Incendie OVHcloud Strasbourg : le point de situation, les dernières nouvelles, et les premières questions

Nous avons collecté les dernières nouvelles et les premières opinions concernant l’incendie du datacenter OVHcloud de Strasbourg.

Dernière minute : dans un entretien aux Echos publié ce matin, Michel Paulin, le directeur général d’OVHcloud, a indiqué : « Il faut qu’on comprenne pourquoi le feu a été si rapide ». La question nous interpelle, lire la dernière partie de notre article…

Cet article fait suite et complète ceux que nous avons déjà consacrés à l’incendie :

Les informations communiquées pas OVHcloud

Dans un communiqué, OVHcloud a indiqué qu’une mise à jour de la situation sera publiée aujourd’hui, le 12 mars.

Hier 11 mars la société indiquait :

Équipes :
Nos équipes RH sont arrivées sur place aujourd’hui pour appuyer les équipes travaillant sur le site.
Un bureau temporaire a été déployé sur place.
D’autres équipes industrielles et techniques OVHcloud, sont arrivées sur place en renfort et pour fournir une expertise spécifique.
Nous avons renforcé le personnel sur le site de production français (Croix) par des volontaires internes, ceci, pour faire face au plan de production actuel ainsi qu’à la charge de travail supplémentaire causée par l’incident de Strasbourg.
La production des serveurs se fera en heures de travail prolongées et pendant le week-end.
Production et Datacenters :
Nous avons commencé à proposer à nos clients une infrastructure de remplacement (serveurs dédiés, Cloud privé et Cloud public) dans les Datacenters de Roubaix et Gravelines.
Pour répondre à la demande, il est prévu de déployer des chaînes de montage supplémentaires au cours des 48H à venir pour multiplier par 3 notre capacité de production.
Sur le site de Strasbourg :
Diagnostic et inventaire en cours aujourd’hui .
Nettoyage et réparation des bâtiments endommagés en cours pour garantir un environnement de sécurité pour nos équipes.
Le nettoyage de la mousse et l’aspiration de l’eau dans la rue sont faits. L’aspiration du réservoir d’eau est prévue aujourd’hui.
SBG2 doit être presque entièrement reconstruit.
SBG1 a été lourdement endommagé.
Salle de réseau SBG1 – Salle conservée à la suite de la vérification préliminaire ETA : début de la semaine prochaine.
ETA provisoire pour électrique : lundi 15 mars.
Les jours suivants, les serveurs seront activés pièce par pièce après audit.
Pour SBG4 : les vérifications préliminaires et ne révèlent aucun problème. L’objectif est maintenant de rétablir l’électricité en semaine 12 et de rétablir progressivement tous les services.
SBG3 non touché par l’incendie. L’objectif est de rétablir le courant et le réseau semaine 12 et de restaurer progressivement tous les services.
Nos trois priorités sont les suivantes :
Réserver des infrastructures sur nos autres datacentres pour les clients impactés : sur les sites de Roubaix et Gravelines, nous disposons d’un stock de nouveaux serveurs prêts à être livrés auprès d’une majorité de clients impactés. Nous allons renforcer encore la disponibilité dans ces datacentres avec la production de près de 10 000 nouveaux serveurs dans les prochaines semaines. La procédure sera communiquée aux clients concernés dès que possible.
Sécuriser le site, auquel nous avons désormais accès, le nettoyer puis rétablir l’électricité et le réseau pour les trois datacentres impactés.
Continuer à évaluer avec nos clients l’impact sur leurs services situés sur les datacentres concernés afin de trouver les meilleures solutions.
Actions supplémentaires entreprises par OVHcloud : Réseau
Toutes les connexions « fibres » entrantes dans le Datacenter sont OK.
Toutes les commandes passées auprès de différents fournisseurs – ETA à recevoir sur place le 11 mars.

L’impact de l’incendie chez les clients d’OVHcloud

Nous disposons d’une idée plus précise de l’impact de l’incendie sur les clients d’OVHcloud via Netcraft, la société britannique qui sonde les noms de domaines :

  • 3,6 millions de sites web hors service.
  • 464 000 noms de domaines distincts hors ligne.
  • Plus de 18 % des adresses IP attribuées à OVH ne répondaient plus le 10 mars entre 7h et 8h.

Le nombre de services mails impactés sera probablement plus difficile à comptabiliser…

Si beaucoup d’entreprises clientes n’ont pas encore réagi, on en sait un peu plus avec celles qui ont publiquement indiqué qu’elles ont été affectées et leurs sites mis hors service :

  • La plateforme d’accès aux données publiques data.gouv.fr a été temporairement inaccessible.
  • La plateforme de gestion de la vaccination contre la Covid-19 a été temporairement inaccessible.
  • La plateforme de jeu vidéo Rust Community a un temps tout perdu, mais ses données se trouvent dans la salle SBG3, épargnée par l’incendie.
  • Le cabinet de conseil en management Axys Consultants n’est plus accessible, tous ses sites et outils se trouvaient sur le même domaine.
  • Le service de location de scooters électriques en libre-service Cityscoot est hors ligne.

Nous n’irons pas plus loin dans les exemples, ils vont certainement se dévoiler dans les prochains jours, mais les scénarios décrits seront globalement les mêmes. 3,6 millions de sites web impactés, cela représente un paquet d’entreprises, d’administrations et de services.

Les opinions qui émergent

Nous avons déjà souligné la réactivité et la transparence d’OVHcloud dans sa communications, en particulier les interventions d’Octave Klaba qui a informé de l’évolution de l’incendie via Twitter. Voilà qui dénote face à la communication fermée, voire à l’absence de communication de certains grands acteurs du datacenter qui ,ont également rencontré des incidents.

Pour autant des critiques émergent, beaucoup de clients ignorant dans quel datacenter – SGB1, SGB2, SGB3, SGB4 ou SGB5 ? – sont leurs serveurs, également où sont les sauvegardes. Il semble que les équipes d’OVHcloud ne semblent pas en capacité de répondre à cette question, qui place ces clients dans l’expectative.

Les principales critiques ne vont cependant pas à OVHcloud, mais aux politiques de sécurité mises en place par les clients de l’opérateur. Et là, en la matière, la responsabilité ne relève pas d’OVHcloud mais des services déployés par ses clients pour protéger leurs sites et leurs données.

  • Il apparaît une nouvelle fois que beaucoup trop d’utilisateurs n’ont pas investi dans une sauvegarde…
  • La seule sauvegarde ne suffit pas, encore faut-il qu’elle ne soit pas sur le même serveur dans le même datacenter !
  • Dans les retours exprimés, les organisations qui ont mis en place un PRA s’en tirent nettement mieux.

La question de l’origine et de la propagation de l’incendie

L’origine de l’incendie ne nous est pas connue au moment où nous écrivons ces lignes.

Ce qui interpelle les experts que nous avons contactés – mais qui ne souhaitent pas être cités, car ce qui domine actuellement dans la communauté française du datacenter, c’est la solidarité avec OVHcloud et ses équipes – ce n’est pas seulement l’origine du feu, c’est aussi la propagation de l’incendie.

Le Commandant Damien Harroué, qui a commandé les opérations de secours, a pointé les planchers en bois, ainsi que « des matières plastiques, ça génère des fumées importantes et des flammes« .

La conception même du datacenter, à bas coût et sur cinq étages, aurait également pu favoriser la propagation de l’incendie.

Tous cela n’est que conjecture, de même que la question des moyens de détection et de sécurité interne, et il faudra certainement attendre les conclusions de diverses enquêtes avant d’émettre des conclusions.