Liens Rapides
Support technique

Toujours dans le but d’apporter des solutions efficaces et réactives à nos clients, nous nous donnons la possibilité de prendre la main directement sur leur poste, et ce quel qu’ils soient !

Consulter notre plaquette de présentation et nos conditions générales de vente Plaquette de présentation de VMR Global Solutions * Contacter nous pour toutes vos demandes de conception de PDF dynamique

Last @VMRGlobalSol Tweets
Inscription à la newsletter
VMR Global Solutions | Les plans de secours informatique à l’heure du Cloud
1735
single,single-post,postid-1735,single-format-standard,ajax_fade,page_not_loaded,smooth_scroll,,wpb-js-composer js-comp-ver-3.7.4,vc_responsive

Les plans de secours informatique à l’heure du Cloud

16:15 07 June in Informations
0 Comments

Le rôle de l’informatique est devenu fondamental dans les processus métiers de l’entreprise. L’interruption du fonctionnement du système d’information a aujourd’hui des conséquences importantes, qui se concrétisent généralement par une perte nette de chiffre d’affaires.

Malgré cela, près d’un tiers des entreprises de plus de 200 salariés n’ont mis aucun plan en place pour gérer la continuité de leur activité (selon le rapport du Clusif), et ceci malgré la poussée des obligations réglementaires (SOX, SSAE16, ISAE 3402, Bâle II, LSF).

Pourtant, les risques sont bien réels : avec le développement du BYOD, la progression du nomadisme, les attaques virales, sans oublier les catastrophes naturelles subies ces dernières années dans plusieurs pays, les systèmes d’information (SI) sont de plus en plus exposés. Une simple panne informatique ou de réseau peut affecter sérieusement la disponibilité du SI.

En dehors des grands groupes et des activités soumises à des contraintes réglementaires fortes, les entreprises sont souvent freinées par le coût non négligeable de la mise en place d’un Plan de Reprise d’Activité (PRA) ou d’un Plan de Continuité d’Activité (PCA). Mais des solutions existent pour adapter le dispositif au risque encouru, avec des coûts optimisés, en profitant notamment du Cloud.

Quantifier le risque

Le coût d’un plan de secours, qu’il s’agisse d’un PRA ou d’un PCA, doit être mis en regard du coût des dommages subis lors d’un sinistre, jusqu’au retour à l’état nominal. Il ne faut pas oublier de regarder aussi les conséquences indirectes sur le revenu et sur la dégradation de l’image de l’entreprise suite au temps perdu et à l’interruption de services critiques tels que logistiques, financiers. Pour quantifier ces dommages potentiels et choisir le plan le mieux adapté, la première étape est de recenser les applications ou domaines les plus critiques, dont l’impact est le plus important sur l’activité de l’entreprise.

Prenons le cas, par exemple, de la plateforme e-commerce d’une entreprise, grande ou petite. Le risque est facilement quantifiable : il s’agit de la perte de chiffre d’affaires générée par l’interruption de services, à laquelle s’ajoute le dommage subi par la marque (une interruption trop longue décourage les internautes de revenir sur le site). Plusieurs solutions s’offrent à elle pour répondre aux effets d’une interruption de services :

Externaliser sur une plateforme redondante

Généralement, l’entreprise externalise sa plateforme chez un hébergeur, dans un data center pour bénéficier d’un environnement technique à l’état de l’art ainsi que de connexion performante à Internet. Ceci permet également de séparer une plateforme « ouverte » d’avec d’autres systèmes internes de l’entreprise.

Au-delà du risque de perte de données, il est important de définir le temps de rétablissement du service, RTO – Recovery Time Objective – qui peut être différent selon la criticité (2h, 4h ou 24h). Le premier élément est donc de disposer d’une architecture redondante au sein du data center primaire et, en cas d’interruption, de pouvoir restaurer rapidement l’environnement et les données.

Envisager la virtualisation et les architectures hybrides

La virtualisation est une solution à envisager : plus grande est la part virtualisée de votre plateforme, plus vous pouvez bénéficier de la haute disponibilité du Cloud. Avec l’économie réalisée, vous pouvez augmenter la résilience de la part non virtualisable de votre plateforme. Vous obtenez une architecture hybride composée de Cloud, d’éléments dédiées et d’une interconnexion réseau performante : c’est le Cloud Hybride ou « Hybrid Cloud ».

Le cloud permet de bénéficier d’une mise à disposition de la puissance non utilisée pour d’autres machines virtuelles et donc d’augmenter le ROI de la plateforme.

Plan de Secours en mode actif/passif

Si le coût d’une interruption de services est élevé, il faut alors envisager un plan de secours mobilisant deux data centers, en mode actif/passif ou voire même atteindre un mode actif/actif, où la résilience est plus élevée et si l’application supporte un tel dispositif.

En mode actif/passif, le mode de réplication des données est, en général, asynchrone. Une attention particulière devra être portée sur le système de réplication afin de prendre éventuellement en compte une hétérogénéité des solutions de stockages.

Si le client souhaite limiter la perte des données il est possible de mettre en place une réplication synchrone même en architecture active – passive.

A titre d’exemple, NTT Communications choisit le data center de secours approprié (en France, en Europe ou dans le monde) en fonction du RPO (Recovery Point Objective, c’est à dire la Période maximale acceptable de perte de données) défini avec le client et de la technologie de stockage choisie.

Le plan de secours sera d’autant plus facile et économique, que la part du cloud privé virtuel sera importante. En effet, le cloud permet d’ajuster les coûts aux ressources réellement nécessaires. Ainsi, lorsque ce plan se déclenche, il est possible d’activer très rapidement davantage de ressources, pour prendre en compte l’augmentation de charge. L’intérêt est de pouvoir ajuster la puissance du système en quelques clics.

En mode actif/passif, nous faisons face au problème de l’informatique « dormante » : le côté passif – i.e. la plateforme de secours en attente – doit être diminuée au maximum, ou alors on doit veiller à l’utiliser à un autre usage, en régime normal, comme la pré-production.

Profiter des plateformes de pré-production

En effet, pour les plateformes en production vitales (e-commerce, ERP, etc.), les nouvelles versions des sites ne peuvent plus être publiées directement. Des environnements sont utilisés, pour tester et valider les nouvelles versions avant leur mise en production. Ce système, appelé plateforme de pré-production, peut être hébergé sur un autre data center. Or, ces plateformes de pré-production ne sont pas critiques – puisqu’elles ne jouent pas de rôle opérationnel.

Une astuce est donc d’attribuer à ces plateformes un double rôle : celui de plateforme de pré-production et celui de plateforme de secours. Grâce aux techniques au Cloud, et à des procédures bien rôdées, il est possible, en cas de sinistre, de transformer rapidement la plateforme de pré-production en plateforme de secours, le temps de remettre en service le système principal.

Pour pousser plus loin l’exercice, il est possible de mettre sur deux data centers différents, deux plateformes de production correspondants à deux applications différentes de telle manière à ce qu’une plateforme puisse accueillir l’autre.

Plan de secours en mode Actif/Actif

En effet, si l’impact économique d’un arrêt de la disponibilité de la plateforme est encore plus important, il faut envisager de mettre en place une double-plateforme, répartie sur deux data centers en mode actif/actif. Les deux plateformes restent continuellement actives et le trafic est alors réparti sur les deux centres en permanence. Bien entendu, des contraintes supplémentaires apparaissent :

le dimensionnement est calculé de façon à ce que les deux plateformes puissent, en cas de sinistre, accueillir le trafic du data center indisponible,

Un système d’équilibrage de charge global doit être mis en place entre les deux sites,

la réplication des bases de données entre les deux data centers doit se faire en quasi-temps réel. La mise en place d’un lien haut-débit à latence faible entre les deux centres est nécessaire. La distance peut atteindre aujourd’hui 100 km.

Sources :

  • Toolinux
  • Samuel Charles, responsable Architecture et Support chez NTT
No Comments

Sorry, the comment form is closed at this time.