Auteur : Rainer W. Kaese, Senior Manager Business Development, Storage Products Division, Toshiba Electronics Europe GmbH
Rainer W. Kaese évoque les tests concernant les différentes approches de stockage, réalisés au sein des Global Data Centers EMEA, une division de NTT Ltd.
En tant que responsable informatique d’une entreprise ou d’un fournisseur de services, si vous deviez prendre en charge 100 nouveaux employés par an au cours des 5 prochaines années, de combien de capacités de stockage et de performances supplémentaires auriez-vous besoin ? Comment mettriez-vous cela en place à partir de votre infrastructure existante ?
Ce n’est pas évident, et il faudra certainement une adaptation sur la période d’implémentation. Toutefois les coûts sont faciles à calculer. Et vous avez probablement une idée des fournisseurs vers lesquels vous vous tournerez.
Cependant, que se passe-t-il si on vous demande de développer le concept de stockage pour le nouveau service d’un fabricant automobile? Imaginons que ce dernier prévoit de déployer une solution de conduite autonome connectée au cloud. Il bénéficie d’estimations approximatives du nombre de voitures par an et de la quantité de données. Cela nécessite de comparer les différentes approches en matière de datacenters et de voir si le tout est financièrement viable.
Maintenant, que se passe-t-il lorsque vous avez besoin de tester votre approche ? Avez-vous un rack, des serveurs, des disques durs et une capacité réseau de secours ? Probablement pas. Bien qu’une solution de stockage cloud semble appropriée, ce n’est pas la solution idéale pour tout le monde. A grande échelle, ce n’est pas non plus la moins chère.
Pour gérer des données plus sensibles ou des approches d’implémentation, il est logique de conserver les données dans un endroit physiquement sécurisé. Mais cela nécessite de l’espace, de la connectivité et beaucoup de matériel, ce qui n’est pas bon marché non plus.
Grâce aux Global Data Centers EMEA, une division de NTT Ltd., tester des idées stockage et mettre en œuvre des services innovants est plus facile que jamais. Leurs Technology Experience Labs offrent non seulement de l’espace, de la puissance et de la protection, mais également la liberté d’innover avec les technologies de cloud et de stockage. Le tout avec le soutien d’une communauté dynamique.
Cela permet aux gestionnaires de datacenters et aux fournisseurs de services d’innover rapidement et à faible coût pour tester des clouds privés ou hybrides. Ils peuvent également examiner des architectures distribuées et mesurer leur impact sur la prestation de services informatiques. Tout cela avec le soutien d’une communauté liée par des webinaires, des boot camps, des meetups et des hackathons.
Le site principal est basé à Francfort (Francfort 1), où 65 000 m² d’espace sont disponibles pour les serveurs. Le bâtiment étant spécifiquement conçu pour fonctionner comme un datacenter. Alimenté par deux sous-stations distinctes de deux alimentations distinctes et protégé par deux alimentations sans coupure (UPS) et des systèmes d’alimentation redondants au diesel, l’alimentation est sécurisée.
La sécurité physique et le contrôle d’accès garantissent que les systèmes sont protégés contre un large éventail d’attaques potentielles. Par ailleurs, le bâtiment bénéficie d’une surveillance 24/7 et d’une redondance des systèmes.
Une connectivité jusqu’à 10 Gbit/s peut être fournie par plus de 350 fournisseurs, allant du moins grand au plus grand. Ce campus particulier est également relié par une connexion par fibre optique au datacenter de NTT à Rüsselsheim (Francfort 3), ce qui permet des implémentations multi-sites.
À ce jour, un large éventail de cas d’utilisation a été testé, allant du cloud hybride, au stockage et au Big Data, en passant par le DevOps et la gestion des applications, à la haute performance et au calcul cognitif. Des études sur les approches matérielles, telles que les tests de refroidissement par eau avec récupération de chaleur perdue, ont également été entreprises.
Pour revenir aux exemples mentionnés plus haut, de nombreux responsables IT et de datacenters, ainsi que des fournisseurs de services chercheront à poursuivre la mise à jour, ou la mise à l’échelle verticale, de leurs systèmes existants, en ajoutant plus de matériel et de disques pour augmenter les performances et la capacité de stockage.
Si cela semble être la bonne solution face aux défis rencontrés, alors NTT fournit un environnement dans lequel de telles approches peuvent être évaluées.
Cela a été démontré avec un serveur de stockage de données hautes performances ciblant des besoins de fiabilité et de performances élevés qui pourraient être utilisés pour diverses cibles iSCSI avec des tailles allant de 10 To à 40 To. Le système, installé en 2017, utilisait des serveurs Supermicro X10 Series au format 2U, comprenant deux processeurs Intel Xeon et 128 Go de RAM. Celui-ci a été couplé à un contrôleur Microsemi ASR8885, à des cartes réseau 10 Gbit/s et à un toploader JBOD à double extension de 60 baies de Celestica. Le stockage a été implémenté à l’aide des disques durs d’entreprise Toshiba MG04SCA40EA de 4 To avec une interface SAS à 12 Gbit/s, des performances de 7 200 tr/min dans un format 3,5 pouces.
Le système a été construit sur Open-E JovianDSS, un logiciel de stockage de données basé sur Linux utilisant le système de fichiers ZFS. Il peut être utilisé pour concevoir le stockage sur les protocoles iSCSI, Fibre Channel (FC), NFS et SMB (CIFS).
Grâce à sa base Linux, il a un haut niveau de compatibilité matérielle et est bien adapté aux environnements de stockage virtualisés. Tout en offrant une intégrité et une protection des données élevées à l’aide de la sommation de vérification et d’auto-réparation des données et des métadonnées pour détecter et corriger les erreurs, il peut également être configuré dans le cadre d’un cluster à double contrôleur actif-actif.
À la fin, la solution a fourni 108 To de stockage utilisateur avec une efficacité de capacité Zpool de 50% en utilisant un type de redondance de stockage miroir bidirectionnel. Le Zpool a été organisé en 30 groupes de paires de disques de données/parité, fournissant 240 To de capacité brute non formatée et 120 To net. Le stockage final utilisable de 108 To a fourni une cote de performance de lecture Zpool de 12,9x disque unique, avec des performances d’écriture Zpool atteignant 8,5x disque unique.
Excepté pour un seul arrêt planifié pour une mise à jour logicielle, le système est opérationnel sans interruption ni panne de disque depuis août 2017.
En plus des groupes miroirs, les groupes à parité double et triple sont également pris en charge. L’approche à triple parité est recommandée avec des disques haute capacité de 10 To ou plus. À ce niveau de parité, le dysfonctionnement de trois disques par groupe de données peut être toléré.
De plus, Open-E JovianDSS prend en charge une approche d’auto-sauvegarde du stockage avec un contrôle de version possible jusqu’à chaque minute. La fonction de sauvegarde crée des instantanés de rotation automatiques d’un volume selon des plans d’intervalle de rétention définis par l’utilisateur, répliquant de manière asynchrone les deltas d’instantanés vers le stockage local (sur site) ou distant (hors site).
L’application de sauvegarde est très légère, ce qui explique pourquoi elle peut fonctionner 24h/24 et 7j/7 sans aucune influence significative sur la production. Il peut être utilisé à des fins de sauvegarde/restauration régulières ou pour une reprise instantanée après sinistre.
Au-delà d’être une activité de preuve de concept de stockage à grande échelle, ce cluster sert également d’infrastructure de stockage virtuel du Technology Experience Lab pour tous les autres innovateurs. Cela en fait une excellente plate-forme pour prouver quotidiennement les avantages fonctionnels et de performance dans des conditions de fonctionnement réalistes.
En ajoutant plus de disques durs dans les boîtiers JBOD, ce cluster a le potentiel de se développer à mesure que les besoins de stockage augmentent. La limite supérieure de cette mise à l’échelle est déterminée par l’espace rack disponible, la portée via le câblage SAS, le nombre de ports SAS sur le ou les contrôleurs et la puissance de calcul du serveur de contrôle. La mise à l’échelle de ce cluster JovianDSS particulier dans le Technology Experience Lab serait probablement possible jusqu’à la plage de pétaoctets basse à un chiffre mais, en raison des limitations mentionnées, pas au-delà de cette capacité.
Bien sûr, si votre croissance future et votre base d’utilisateurs sont inconnues, comme dans l’exemple automobile donné, une approche différente est requise. Elle évoluera selon les besoins et n’aura pas de limite supérieure réelle de capacité. Cela nécessite une évolutivité horizontale, également appelée stockage évolutif.
Le stockage évolutif utilise une approche basée sur la connectivité réseau qui permet d’ajouter de nouveaux nœuds, presque sans limite, aux clusters existants selon les besoins. Chaque cluster comprend un certain nombre de serveurs, de lecteurs et de mise en réseau. Les nœuds de cluster étant reliés entre eux par un réseau à haute vitesse ou un fond de panier.
Grâce à cette approche, il n’est pas nécessaire de surprovisionner car la capacité et les performances peuvent être ajoutées selon les besoins. La solution de stockage complète apparaît, pour les utilisateurs, comme une entité unique et peut être administrée via une interface unique, même lorsque des parties de l’implémentation matérielle sont situées dans d’autres villes ou sur d’autres continents.
Pour garantir que cet ensemble de matériel fonctionne à la fois comme une seule entité de stockage et offre des possibilités d’extension, de basculement et de robustesse, un logiciel approprié devra également être sélectionné. L’approche de NTT est à nouveau idéale pour tester des combinaisons de matériel et de logiciels afin d’apprendre comment elles interagissent. Cela pourrait être de déterminer ce qui fonctionne le mieux pour les besoins individuels, comme effectuer une récupération système partielle ou complète après une attaque de ransomware dans un environnement opérationnel réaliste.
Un de ces systèmes utilise PetaSAN, une solution évolutive de réseau de stockage (SAN) basée sur Ceph. Ceph est une plate-forme de stockage open source leader qui vise à offrir un stockage au niveau objet, bloc et fichier à l’aide d’un cluster de calcul distribué. En outre, il offre une capacité de stockage évolutive et reproduit les données, ce qui le rend tolérant aux pannes et à la fois auto-réparateur et autogéré.
L’un des défis est qu’il nécessite la configuration et la maintenance d’un administrateur Linux, un problème que le projet open source PetaSAN vise à résoudre. Cela englobe la puissance et la complexité de Ceph dans une interface de gestion « à vitre unique » tout en fournissant simultanément un accès à la puissante ligne de commande Linux en cas de besoin.
L’objectif est de fournir des disques iSCSI en cluster à haute disponibilité, chaque disque iSCSI étant mappé à tous les disques physiques du système. Cela signifie que, par exemple, dans un environnement d’hyperviseur en cluster, les transactions simultanées de plusieurs machines virtuelles (VM) peuvent être prises en charge sans aucun impact notable sur les performances.
La plate-forme a été construite à l’aide de matériel de Starline Computer GmbH, composé de cartes RAID Areca en mode pass-thru couplées à des adaptateurs Ethernet à accès direct à la mémoire à distance (RDMA) 10Gbe de Cavium. L’implémentation PetaSAN fournit 220 To de disques iSCSI en grappe hautement disponibles grâce aux disques durs d’entreprise haute capacité de 10 To de Toshiba. Les disques multi-chemins résultants peuvent être identifiés par des adresses IP virtuelles et offrir des E / S rapides avec redondance de liens.
De plus, ce système fournit les ressources de stockage virtuel pour les Technology Experience Labs, en particulier pour les activités de validation de principe où ses fonctionnalités d’extensibilité sont requises.
Bien sûr, l’intention finale n’est peut-être pas d’exploiter et d’entretenir le matériel d’une solution de stockage, ou la mise en œuvre peut avoir besoin d’utiliser un mélange de matériel propre et de ressources cloud. Dans de telles situations, l’utilisation du service de stockage simple d’Amazon (S3) peut être une option à considérer. Grâce au travail de Starline, cette plate-forme de test intègre une passerelle S3 via la ligne de commande qui devrait acquérir le support de configuration GUI à l’avenir.
Il est difficile de déterminer l’approche optimale pour un datacenter, en particulier avec des exigences de performances et de capacités en croissance continue, mais pas nécessairement de quantités connues et planifiables. Des environnements tels que celui fourni par NTT avec son espace physique professionnel et sa communauté de support, laissent place à l’expérimentation à l’aide de systèmes significatifs. À leur tour, les solutions réelles aux défis quotidiens peuvent non seulement être évaluées mais aussi quantifiées dans des conditions non critiques pour le système.