Données scientifiques

Une infrastructure hors norme pour protéger et conserver le patrimoine scientifique d’ITER

Le centre de calcul et de données scientifiques d’ITER n’est pas un centre de données comme les autres. Cette « salle des machines » numérique spécialement conçue pour le programme associe des capacités de calcul de pointe et un système de stockage industriel afin de faciliter la mission scientifique d’ITER, lui permettant de réaliser des simulations à grande échelle, de gérer de gigantesques volumes de données et de garantir la conservation à long terme de ses archives de recherche et d’ingénierie.

L’infrastructure initiale offre une capacité de stockage à haute performance de l’ordre de 5 pétaoctets (PB), soit l’équivalent de plus d’un million de longs métrages en HD, qui devrait augmenter rapidement au fil de l’avancée du programme.

Alors que la plupart des ordinateurs portables ou de bureau ne possèdent que quelques cœurs de processeur, les systèmes de calcul à haute performance (HPC) fonctionnent à une tout autre échelle. Le système HPC d’ITER compte plus de 17 000 cœurs d’unité centrale, soit la puissance combinée de plus de 2000 ordinateurs portables travaillant en parallèle. Cette formidable capacité de calcul permet aux chercheurs de modéliser la dynamique des plasmas, de simuler les conditions du réacteur et de réaliser des études techniques complexes dans des délais qui seraient inenvisageables avec des machines classiques.

Le centre de calcul et de données scientifiques d’ITER est une installation ultramoderne conçue pour recevoir jusqu’à 1 mégawatt (MW) de matériel informatique réparti sur 48 racks, ce qui correspond aux besoins en énergie de tout un quartier résidentiel ou de plus de 300 foyers moyens. Lors de la mise en service du centre, seule la moitié de cette capacité était disponible et la montée en puissance se fera au fur et à mesure de l’augmentation des besoins de calcul d’ITER. Le centre est équipé de systèmes d’alimentation et de refroidissement redondants et de plusieurs circuits de distribution électrique indépendants, et la maintenance peut être réalisée sans interrompre les services critiques. En pratique, cela signifie qu’il devrait fonctionner en continu, avec moins de 1,6 heure de mise à l’arrêt par an.

Les données constituent un atout stratégique pour ITER. Elles ne sont pas un simple corollaire des expérimentations et de la conception technique mais l’un des principaux produits générés par le programme. La sauvegarde de ces données est donc une priorité absolue. Lorsqu’il fonctionnera à plein régime, le centre de données devrait gérer un débit de 30 à 50 gigaoctets par seconde et les volumes d’archivage quotidiens pourraient atteindre 90 à 2200 téraoctets selon les étapes du programme. D’ici 2035, le volume cumulé de données archivées devrait passer la barre de l’exaoctet (un milliard de gigaoctets), ce qui en fera l’un des plus gros entreposage de données scientifiques au monde.

Pour fonctionner de manière sûre et efficace à une telle échelle, le centre de calcul et de données scientifiques fait appel au système de fichiers en cluster à haute performance IBM Spectrum Scale pour la gestion des charges de calcul actives. Afin de satisfaire aux exigences de résilience et de redondance, il utilise aussi le système de sauvegarde hors site et de restauration de données IBM Spectrum Protect, qui permet de répliquer les données critiques vers des emplacements sécurisés situés en dehors du site principal. L’infrastructure de sauvegarde prend en charge plus de 1000 serveurs et espaces de fichiers et offre ainsi une plateforme centralisée pour la gestion et la protection de l’ensemble de l’écosystème numérique d’ITER.

L’infrastructure du centre de calcul et de données scientifiques permettra non seulement de constituer le patrimoine scientifique d’ITER mais aussi de le protéger, de le conserver et de le partager à travers le monde.