En octobre 2020, un chercheur de l’Université de New York (NYU) fait une découverte révolutionnaire. Elle a découvert la biophysique structurale du nouveau virus SRAS-CoV-2 à l’origine de la COVID-19. La révélation est venue quelques mois seulement après que NYU a installé un super-ordinateur lenovo énorme dans la région métropolitaine de New York.
« Cette chercheure en chimie n’a pas pu terminer son travail sur notre ancienne infrastructure », a déclaré David Ackerman, vice-président associé à la technologie de la recherche, NYU IT et directeur du numérique dans les bibliothèques de la NYU. Ackerman est responsable des services et de la stratégie de la technologie de recherche de la NYU. « Notre nouvelle infrastructure n’a pris que 30 heures. »
David, le nouveau super-ordinateur, « est révolutionnaire pour nous et le monde. »
Mais l’installation d’un Informatique haute performance (HPC) cluster au plus fort d’un pic de cas de COVID-19 sur la côte Est n’était pas un exploit mineur. L’accès, le voyage et la capacité de rencontrer le client étaient limités. Et cela n’a pas arrêté deux ingénieurs Lenovo indomptables.
En juillet, Chris Eckhoff est allé 24 heures de sa maison en Floride à New York pour installer le super-ordinateur de la NYU. C’est plus de 1,000 miles (1,600 kms)!
SOLUTIONS EN VEDETTE
Services de santé Lenovo
Informatique haute performance Lenovo
Services exhaustifs
Chris a finalement été rejoint par Chulho Kim, un autre employé de longue date de Lenovo. Ils ont passé des mois à sortir d’un hôtel pour s’assurer que l’installation parte sans accroc. Ils ne sont partis que pour travailler et acheter de la nourriture.
« Ce fut une période exceptionnelle en raison de circonstances exceptionnelles », a déclaré Chris. « Mais le service doit continuer. »
Et l’installation était exceptionnellement urgente.
« L’idée qu’on ne serait pas aller vite est inacceptable », a ajouté David. « J’ai écrit à Lenovo : Nous avons besoin de ce super-ordinateur, et nous en avons besoin maintenant pour aider le monde! »
Ils disent que la meilleure technologie ressemble à de la magie, et c’est comme de la magie.
- David Ackerman, AVP, services de recherche et CDO, bibliothèques NYU
« Il devait être opérationnel parce que plusieurs des chercheurs utilisant le système allaient faire des recherches sur la COVID », a déclaré Scott Tease, directeur général, HPC et IA, Lenovo. « L’équipe nyu a lancé un défi à Lenovo et à leurs autres fournisseurs pour demander notre soutien afin que le système soit lancé dans des moments aussi difficiles, et nous avons répondu. »
L’obtention d’un système de cette taille et de cette complexité conçu et expédié pendant une période sans précédent n’est pas une mince tâche. Heureusement, le duo a été soutenu par les équipes de la chaîne d’approvisionnement mondiale de pointe de Lenovo qui ont travaillé sans relâche pour assembler le super-ordinateur, le tester dans l’usine et gérer la logistique d’une arrivée synchronisée au centre informatique de la NYU, juste à temps pour la mise en marche.
NYU n’aurait pas pu être plus impressionné par les résultats. David, l’un des plus grands appels à travailler avec Lenovo, est le portefeuille de serveurs haute performance équipé de la technologie de refroidissement liquide Neptune™ de Lenovo. Non seulement le système est plus vert et plus économique que les autres systèmes, mais il est également plus puissant.
« Notre numéro TOP500 original nous a donné une cote de 1,729 pétaFLOP, dit-il. Le projet TOP500 classe et détaille les 500 superordinateurs les plus puissants du monde, qu’il mesure en pétaFLOPS. Ce nombre est passé à 2,008, « simplement en ayant le refroidissement direct par l’eau », une augmentation de 20 %.
« Ils disent que la meilleure technologie ressemble à de la magie, et cela ressemble à de la magie », a déclaré David.
Chulho et Chris étaient derrière la magie, qui travaillaient en tout temps alors qu’ils appliquaient leur expertise et leur agilité pour s’assurer que le cluster soit installé à temps.
Le nouveau super-ordinateur est révolutionnaire pour nous et le monde.
Habituellement, un membre de l’équipe travaille uniquement au dépannage et à l’identification des problèmes matériels. « Le plus difficile est le dépannage, en figurant pourquoi un certain nud est lent, si votre réglage de réseau est correct, et ainsi de suite. » Le cluster est seulement aussi fort que son maillon le plus faible, ce qui signifie que même des problèmes mineurs impactent la configuration.
Mais cette fois-ci, il devait porter plusieurs chapeaux, « courir des tests, remplacer des pièces ». Après tout, la construction d’un super-ordinateur n’est pas un petit exploit. Un super-ordinateur typique emploie des dizaines de milliers de curs travaillant en parallèle. Dépannage pour un tel appareil, dit Chulho, c’est comme chercher une aiguille dans une botte de foin.
« Plusieurs facteurs ont fait de ce projet un projet stimulant », a ajouté Chris. Normalement, un cluster HPC est installé en contact étroit avec le client et avec une équipe de deux à trois personnes. Les choses ont fonctionné différemment cette fois-ci. Mais Chris poussa l’avant, travaillant à respecter l’échéance pour que les recherches de la NYU puissent se poursuivre sans entraves.
Chulho dit que l’expérience lui a appris que le succès est possible même lorsque les choses semblent impossibles. Au moins, il s’est rendu compte qu’il « devait tenter l’affaire ».
« Je ne pensais pas qu’il y avait une autre option, dit-il.