Test Alt
SANTÉ

Un supercalculateur Lenovo à la New York University pour poursuivre les recherches

Écouter l'article audio
Chris Eckhoff et Chulho Kim de Lenovo sont des hommes de terrain. Récemment, ils ont pourtant été confrontés à un projet qui ne ressemblait à aucun autre. Pendant des mois, Chris et Chulho ont vécu dans un hôtel pour installer en urgence, un supercalculateur à l’Université de New York (NYU), alors que le nombre de cas de coronavirus grimpait en flèche sur la côte Est des États-Unis. Ce supercalculateur était indispensable à la réalisation de travaux cruciaux de recherche sur la COVID-19. Face à des contraintes inimaginables, « le service », déclare Chris Eckhoff, « ne doit pas s’interrompre ».

En octobre 2020, une chercheuse de la New York University (NYU) a fait une découverte révolutionnaire. Elle a découvert la biophysique structurelle du nouveau virus SRAS-CoV-2 à l’origine de la COVID-19. Cette révélation a eu lieu quelques mois seulement après l’installation, par la New York University, d’un énorme supercalculateur Lenovo dans l’agglomération de New York.

 

« Le travail de cette chercheuse en chimie n’aurait jamais pu aboutir avec notre ancienne infrastructure », affirme le Dr David Ackerman, vice-président associé pour les technologies de recherche. Responsable informatique et des services numériques pour les bibliothèques de la NYU. Le Dr Ackerman est responsable des services et de la stratégie de la NYU en matière de technologies de recherche. « Il n’a fallu que 30 heures sur notre nouvelle infrastructure. »

Le nouveau supercalculateur, poursuit David Ackerman, « est révolutionnaire pour nous mais aussi pour le monde entier ».

 

Toutefois, l’installation d’un cluster de calcul haute performance (HPC) au plus fort de la flambée des cas de COVID-19 sur la côte Est n’a pas été une mince affaire. L’accès, les déplacements et la possibilité de rencontrer le client étaient limités. Cela n’a pourtant pas arrêté deux infatigables ingénieurs de Lenovo.

 

En juillet, Chris Eckhoff a conduit 24 heures, depuis son domicile en Floride jusqu’à New York, pour installer le supercalculateur de la NYU. Soit plus de 1 600 km !

SOLUTIONS PRÉSENTÉES

Alt text

Lenovo pour le secteur de la santé 

En savoir plus

Alt text

Ordinateurs haute performance Lenovo

En savoir plus

Alt text

Services de bout en bout

En savoir plus

Chris a finalement été rejoint par Chulho Kim, un autre employé de longue date de Lenovo. Les deux hommes ont passé des mois dans un hôtel pour s’assurer que l’installation se déroule sans problème. Ils ne sortaient que pour travailler et acheter de quoi manger.

 

« C’était une période exceptionnelle pour des circonstances exceptionnelles », raconte Chris Eckhoff. « Mais le service ne doit pas s’interrompre. »

 

Et l’installation était exceptionnellement urgente.

 

« L’idée d’une progression lente était tout simplement inacceptable », ajoute David Ackerman. « J’ai écrit à Lenovo : nous avons besoin de ce supercalculateur, et nous en avons besoin maintenant pour aider le monde ! »

 

« Il devait être opérationnel car de nombreux chercheurs utilisant le système allaient effectuer des recherches sur la COVID », explique Scott Tease, directeur général pour le HPC et l’IA chez Lenovo. « La NYU a lancé un défi à Lenovo et à ses autres fournisseurs en leur demandant de les aider à mettre en place le système en ces temps difficiles, et nous avons répondu à l’appel ».

Alt text

La fabrication et l’expédition d’un système de cette taille et d’une telle complexité pendant une période sans précédent sont réservées aux plus coriaces. Heureusement, le duo a été soutenu par les équipes de la chaîne d’approvisionnement mondiale de Lenovo, à la pointe du secteur, qui ont travaillé sans relâche pour assembler le supercalculateur, le tester en usine, puis gérer la logistique d’une arrivée synchronisée au centre de données de la NYU, juste à temps pour la mise sous tension.

 

La New York University a été très impressionnée par les résultats. L’un des principaux attraits de la collaboration avec Lenovo, a déclaré David Ackerman, est sa gamme de serveurs haute performance équipés de la technologie de refroidissement liquide Neptune™ de Lenovo. Non seulement le système est plus écologique et plus rentable que les autres, mais il est aussi plus puissant.

 

« Notre place initiale dans le TOP500 nous octroyait une note de 1,729 pétaflops », déclare-t-il. Le projet TOP500 classe et détaille les 500 supercalculateurs les plus puissants au monde, qu’il mesure en pétaflops. Ce chiffre est passé à 2,008, « simplement grâce au refroidissement liquide direct », soit une augmentation de 20 %.

 

« On dit que la meilleure technologie ressemble à de la magie, et cela y ressemble bien », poursuit David Ackerman.

 

Derrière cette magie, il y avait Chulho et Chris, qui ont travaillé 24 heures sur 24 pour s’assurer que le cluster serait installé dans les temps, en s’appuyant sur leur savoir-faire et leur agilité.

Alt text

Le nouveau supercalculateur est révolutionnaire pour nous, mais aussi pour le monde entier.

-David Ackerman

Habituellement, un membre de l’équipe travaille uniquement sur le dépannage et l’identification des problèmes de matériel. « Le plus difficile est de résoudre les problèmes, de comprendre pourquoi un certain nœud fonctionne lentement, si le paramétrage de votre réseau est correct, et ainsi de suite. » La puissance du cluster dépend de son maillon le plus faible, ce qui signifie que même les problèmes mineurs ont un impact sur la configuration. 

Mais cette fois, il a dû porter plusieurs casquettes, pour « réaliser des tests et remplacer certaines pièces ». La construction d’un supercalculateur, après tout, n’est pas une mince affaire. Un supercalculateur peut généralement intégrer plusieurs dizaines de milliers de cœurs travaillant en parallèle. Le dépannage d’un tel dispositif, explique Chulho Kim, revient à chercher une aiguille dans une botte de foin.

 

« De nombreux facteurs ont fait de ce projet un véritable défi », ajoute Chris Eckhoff. Normalement, un cluster HPC est installé en contact étroit avec le client et avec une équipe de deux à trois personnes. Cette fois, la situation était différente. Mais Chris est allé de l’avant, s’efforçant de respecter l’échéance pour que les recherches de la NYU puissent se poursuivre sans entrave.

 

Selon Chulho, l’expérience lui a appris qu’on peut réussir, même lorsque les choses semblent impossibles. Au moins, il a compris qu’il « devait essayer ».

 

« Je ne voyais pas d’autre choix », précise-t-il.

CHAÎNE D’APPROVISIONNEMENT