compute virtualization - mise en œuvre d'une …€¦ · – vcloud hybrid service –...
TRANSCRIPT
© 2014 VMware Inc. Tous droits réservés.
Mise en œuvre d’une stratégie de continuité ou de reprise d’activité complète avec VMware
VMware vForum, 2014
Matthieu GrossSolutions Consultant, Global [email protected]
À l’ordre du jour
• Définition du problème
• Définitions
• Technologies VMware qui assurent des fonctions de continuité et de reprise d’activité
– vSphere High Availability et App HA (HA, App HA)
– vSphere Fault Tolerance (FT)
– vSphere Data Protection / Advanced (VDP / VDPA)
– vSphere Replication (VR)
– vCloud Hybrid Service – Disaster Recovery (vCHS – DR)
– vCenter Site Recovery Manager (SRM)
– vCenter Infrastructure Navigator (VIN)
• En savoir plus
La disponibilité et la protection des donnéessont critiques pour l’entreprise
Revenue
Productivité
Conformité
Réputation
Quelle est la différence ?
Évitementde sinistreÉvitementde sinistre
Reprised’activitéReprise
d’activité
Interruptions planifiéesou non planifiées
Tolérance à la panne / Haute disponibilité
• Tolérance à la panne– Capacité de récupération après une panne de composant
– Exemple : défaillance d’un disque dur
• Haute disponibilité
Pourcentage de temps disponible sur un an
Interruptions de service sur un an
99 3,65 jours
99,9 8,76 heures
99,99 52 minutes
99,999 « Les cinq neufs » 5 minutes
X
RTO, RPO et MTD
• Objectif de temps de récupération (RTO)– Quel devrait être le délai de reprise ?
• Objectif de point de récupération (RPO)– Volume de perte de données potentiel
• Tolérance d’interruptions de service maximum (MTD)– Nombre d’interruptions possibles avant que d’importantes pertes
ne surviennent
– Exemples : domaine financier, réputation
Dernièresauvegarde
Temps
Evènement Service restauréImpact potentiel
RPO RTOMTD
Service restauréImpact critique
VMware : plusieurs niveaux de protectionProtection au niveau de la VM par HA/App HA, FT
SQL
vSphere HA/FT
Site A
Rendre un service d’application hautementdisponible• vSphere HA
• NOUVEAU (vSphere 5.5) : prise en compte des règles d’anti-affinitéavant démarrage de la VM
• NOUVEAU (vSphere 5.5) : vSphere App HA
VMware vFabric™ tc Server
vSphere App HA Nouveau
Basé sur des règles
Protection des applications prêtes à l’emploi
vSphere App HA
Cluster vSphere HA
vFabric HypericAppliance virtuelle
vSphere App HAAppliance virtuelle
Agents Hyperics’exécutantdans les VM
vCenterServer
vSphere vSphere vSphere vSphere
Nouveau
vSphere HA – À retenir…
• Le RTO se mesure en minutes (et non en secondes)
• Requiert un stockage partagé
• Meilleures pratiques– Utilisation du contrôle d’admission – règle de pourcentage
– Test post-défaillance des performances en mode maintenance de l’hôte
– Réponse d’isolement – Laisser sous tension
– Redondance du stockage et du réseau
vSphere Fault Tolerance (FT)
• Pas de délai de reprise ni de perte de données– Panne matérielle de l’hôte uniquement
– Ne protège pas contre les pannes d’application et d’OS
• Parfaitement compatible avec HA, App HA
• Pourquoi ne pas mettre en place FT ?– Besoins en ressources ; est-ce vraiment nécessaire pour la charge de travail ?
– VM dotée de plusieurs processeurs (voir BCO5065 ☺)
– Pas de snapshot de VM ; agent nécessaire pour les sauvegardes
VMware : plusieurs niveaux de protectionProtection des données: vSphere Data Protection (Advanced)
SQL
vSphere HA/FT
VDPA
Site A
Protection des données(sauvegarde et restauration )• Des agents ? Aucun agent ? – Les deux !
– Pas d’agent pour la plupart des charges de travail (simplicité garantie)
– Des agents pour certaines applications
• vSphere Data Protection (VDP) Advanced– Sauvegarde et récupération pour et par VMware
– Basé sur la technologie éprouvée et aboutie EMC Avamar™
– Sauvegarde et restauration de VM sans agent
– Agents pour une protection granulaire des applicationsde niveau 1
VDP Advanced – À retenir…
• Conçu pour les environnements de PME
• Utilise VADP (vStorage API for Data Protection) – snapshots de VM, Changed Block Tracking
• Utilise Windows Volume Shadow Copy Service dans les outils VMware
• Parfaitement compatible avec HA, mais pas avec FT
• Le Raw Device Mapping en mode virtuel est pris en charge, mais pas le RDM en mode physique
• S’agit-il d’une solution de reprise d’activité ?– Peut-être, cela dépend des attentes en matière de RTO/RPO
– La réplication hors site est nécessaire, n’est-ce pas ?
VMware : plusieurs niveaux de protectionProtection de site: vSphere Replication, Site Recovery Manager
SQL
vSphere HA/FT
VR/SRMSQL
VDPA
Site A Site B
vSphere Replication – Reprise d’activité
• Outil natif intégré dans la plate-forme
• Réplication par VM au niveau de l’hyperviseur, gérée dans VC
Choix du RPO : de 15 minutes à
24 heures
Datastore de destination
sélectionnable(indépendant du type de disque)
Réplication sur tous les sites
vCenter Server
VMware ESXi
NFC
VRA
VMware ESXi
NFC
VRA
VMware ESXi
NFC
VRA
StockageStockage(VMDK1)
vCenter Server
VMware ESXi
NFC
VRA
VMware ESXi
NFC
VRA
VMware ESXi
NFC
VRA
Appliance vSphere
Replication
Appliance vSphere
Replication
StockageStockageVMDK1
vCenter Server vCenter Server
Une reprise complète en quatre étapesCliquez avec le bouton
droit et sélectionnezRecover (Récupérer).
Cliquez avec le boutondroit et sélectionnez
Recover (Récupérer).
Sélectionnez un dossier cible.
Sélectionnez un dossier cible.
Sélectionnez uneressource cible.
Sélectionnez uneressource cible.
Cliquez sur Finish (Terminer).
Cliquez sur Finish (Terminer).
Validation de vos choix à l’acte
Nouvelle fonction : conservation de répliqueshistoriques
vSphere
AgentvSphere
Replication
Après la récupération, utilisez le gestionnaire de sn apshot pourrevenir à des états antérieurs
La rétentionde multiples instantanéspermet de
revenir à des états antérieurs
connus
Instantanés multiples présentés comme des snapshots de VM après un basculement
Utilisation du gestionnaire de snapshot pour revenir à desétats antérieurs ; une interface dont tous les administr ateurs
sont familiers depuis longtemps.
vSphere Replication – Interopérabilité
� Fault tolerance : non compatible avec VR
• FT entre en conflit au niveau du filtre de disque vSCSI.
� VDP
• Pratiquement aucun problème !
• Si vous utilisez VSS… assurez-vous que c’est la version 5.5 !
� HA, vMotion, DRS
� Storage vMotion et Storage DRS
• La prise en charge est maintenantassurée
vCloud Hybrid ServicesDisaster Recovery to Cloud 1.0
VMware vSphere
VMwarevCenter Server
vSphere Replication
Site A (Primaire)
Servers
vCHS, Site B (Recovery)
US East Region
US West Region
1Dependant de la bande passante disponible
Réplication asynchrone et reprise simple et sécuris ée pour les environnements virtuels vSphere
• US-Nevada• US-Virginia• US-Texas• US-California• EUR-United Kingdom
• Repose sur vSphere Replication
• Capacités warm standby sur vCHS
• Protection self-service, Workflowfailover et failback par VM
• RPO (Recovery Point Objective de 15 min. à 24h 1
• RTO (Recovery Time Objective) garanti de 4 heures
• Support de l’envoi de données offline (via un transporteur)
• Support et SLA de niveau Production
• Options de souscription flexibles
26
Site Recovery Manager (SRM)
• Un moteur de reprise d’activité• Un outil qui utilise des données répliquées en externe
(VR ou basé sur la baie) pour accélérer le RTO d’un plande continuité d’activité
• Un produit qui permet de tester, automatiser, planifier, répéter et personnaliser la reprise d’activité
De quoi s’agit-il ?De quoi s’agit-il ?
• Un moteur de réplication• Un outil pour des systèmes nécessitant un RPO quasi
instantané• Un cluster étiré pour la prévention des sinistres
Ce qu’il n’est pasCe qu’il n’est pas
Principaux composants de SRM
Réplication
vCenter Server
Site Recovery Manager Server
� Un vCenter Server (Windows ou VCVA) par site (versions identiques)
� Un SRM Server par site (versions identiques)
� Des hôtes vSphere, versions identiques par site recommandées (antérieursà vSphere 5.x uniquementsi la réplication de baieest utilisée)
vSphere Essentials Plus et les versions ultérieures s ont prises en charge
vCenter Server
Options de réplication SRM • SRM peut utiliser À LA FOIS la
réplication basée sur les baiesET la réplication vSphere
• SRM « voit » les VM existantes et autonomesprotégées par vSphere Replication
• SRM peut installer vSphere Replication intégralementsi nécessaire
HubLUN 2
Web
Application n-tier
BD
Application
vSphere Replication
Réplication basée sur le stockage
LUN 1
Web
BD
Application
Application n-tier
Workflows de reprise
• Plan de reprise défini par l’utilisateur• Réduction des erreurs
Automatisation du basculementAutomatisation du basculement
• Environnement de test isolé• Amélioration de la confiance dans le
processus de reprise d’activité
Test de basculement sans interruption de l’activitéTest de basculement sans interruption de l’activité
• Aucune perte de données• Migration des opérations
Migration planifiéeMigration planifiée
• Nouvelle protection des VM, annulation de la migration
Automatisation des retours arrièreAutomatisation des retours arrière
Interopérabilité avec SRM
• Fonctionne avec VR et ArrayBased Replication
• Les sauvegardes, VADP ouautre conviennent
• HA ne pose aucun problème
• vMotion et DRS fonctionnentcorrectement
• Storage vMotion and Storage DRS – On peut dire ça…
– Dépendance vis-à-vis de la réplication
• FT est au « jaune »
– Répliqué sur baie uniquement et le statut FT n’est pas récupéré
• Web / Client vSphere
SRM : quelques pratiques d’excellenceListe non exhaustive
De nombreux documents de support sont disponibles sur les blogs, vmware.com et les sites d'informations techniques
Pratiques importantes :
Topologie du stockage
Test de la configuration réseau
Fréquence des tests
Dimensionner vCenter correctement
La plus importante :
Effectuer une analyse d’impact commercial
RPO, RTO, coût des interruptionsde service, interdépendances, importance stratégique des applications, priorités, unités de basculement, facteurs externesnégligés, adhésion des cadres dirigeants, etc.
Groupes de protection
• Davantage de groupes de protection = test granulaire/basculement amplifiés– Le test de reprise d’activité est plus facile et nécessite moins de ressources
– Basculement uniquement des éléments nécessaires
– Configuration plus complexe / Complexité accrue
• Moins de groupes de protection = complexité réduite– Moins de LUN, de groupes de protection et de
plans de reprise
– Flexibilité réduite
• Trouver un bon équilibre entre flexibilité et simplicitéMoins de LUN /groupes de protectionComplexité réduiteFlexibilité réduite
Davantage de LUN / groupes de protectionComplexité accrueUne flexibilité accrue
Un bon équilibreentre complexitéet flexibilitéDépend du client
La majorité des pannessont partielles (n’affectentqu’une partie du data center) – Conception en conséquence
Réseau de test
– Utiliser un VLAN ou un réseau isolé pour l’environnement de tests• Le paramètre Auto par défaut ne permet pas la communication des VM entre
les hôtes
– Différents vSwitch peuvent être spécifiés dans SRM (test / exécution)• Indiqués dans le plan de reprise
En savoir plus• Exercez-vous dans un laboratoire
d’essai pratique en ligne• Demandez à voir une
démonstration• Installez une version d’évaluation
de 60 jours