Décryptage de la panne majeure sur Equinix LD8

Notre commentaire – Malgré la pandémie, l’internet, les réseaux et les datacenters ont tenu… Retour à la réalité avec la panne subie par Equinix, celle d’une efficience mise à mal, d’une résilience à revoir, et probablement la vétusté de certains équipements. Un commentaire qui pourrait s’appliquer à la majorité des datacenters existants.

« Aujourd’hui, Equinix IBX LD8, dans les Docklands, à Londres, au Royaume-Uni, a subi une panne de courant. Cela a eu un impact sur les clients qui y sont basés. La panne peut également avoir affecté les services réseaux des clients. »

Cette déclaration a été la première publiée par Equinix, ce 18 août, environ 8 heures après une panne de courant, déclarée à 4h23 heure locale, avant d’être suivie par le déclenchement de l’alarme incendie, puis d’occasionner d’importants problèmes de réseau.

La défaillance d’un onduleur

Les ingénieurs d’Equinix ont diagnostiqué une interruption de l’alimentation électrique qui aurait pris sa source dans un système UPS défectueux. Des clients d’Equinix évoquent plus directement la défaillance d’un interrupteur statique de sortie dans le système Galaxy UPS vendu par Schneider Electric.

Les deux alimentations A + B ont été perdues, montrant un manque de résilience, et privant d’alimentation un des deux racks d’Equinix LD8. Justement le rack qui abrite les routeurs Juniper MX et Cisco LNS. C’est ainsi que les services réseaux sont tombés et les systèmes de contrôle d’accès du datacenter ont été mis hors ligne. Un problème qualifié de P1, qui impose une priorité maximale.

LD8, ancienne installation Telecity

Les effets de la panne se sont répandus largement au delà de LD8 – le datacenter figure dans l’acquisition de Telecity par Equinix en 2016, et héberge London Internet Exchange (LINX) -, dans l’écosystème télécoms londonien, sur les réseaux des transporteurs et FAI, via les lignes louées. Parmi les victimes figurent des clients de BT, Sky, Virgin Media, Exponential-e, FluidOn, et Giganet. 150 membres (sur 700) du LINX auraient été affectés par la panne. Tous ont restauré leurs équipements à 13h42. Mais également fait remarquer qu’une panne similaire a eu lieu en 2016…

On imagine la frustration de leurs clients. Basé dans les Docklands, à Londres, LD8 sert une concentrations denses de services financiers, de FAI, de services cloud et informatiques, d’entreprises et de sociétés de contenu et de médias numériques.

A 21h50 ce même jour, environ 18 heures après le début de la panne, Equinix a déclaré que les racks ont été restaurés pour tous les clients. Mais certains d’entre eux, Giganet en tête, ont déclaré la panne « inacceptable », et dénoncé un défaut de résilience et un « manque de communication » de la part du géant mondial des datacenters.