Test Alt
GESUNDHEITSWESEN

Es muss auf jeden Fall weitergehen

Chris Eckhoff und Chulho Kim von Lenovo sind Eilaufträge gewöhnt. Vor Kurzem jedoch mussten sie unter ganz neuen Umständen arbeiten. Eckhoff und Kim lebten monatelang in einem Hotel, um einen dringend benötigten Supercomputer an der NYU zu installieren, während die Coronafälle an der amerikanischen Ostküste ihren Höhepunkt erreichten. Der Supercomputer wurde für entscheidende Untersuchungen zu COVID-19 benötigt. Auch angesichts unvorstellbarer Einschränkungen konnten sie laut Eckhoff nicht einfach alles stehen und liegen lassen.

Im Oktober 2020 machte eine Forscherin an der New York University (NYU) eine bahnbrechende Entdeckung. Sie entschlüsselte die strukturelle Biophysik des neuartigen SARS-CoV-2-Virus, das COVID-19 verursacht. Die Enthüllung erfolgte nur wenige Monate nachdem die NYU einen massiven Lenovo Supercomputer in der New York Metropolitan Area installiert hatte. 

 

„Diese Chemikerin konnte ihre Arbeit mit unserer alten Infrastruktur nicht zu Ende bringen“, so Dr. David Ackerman, Associate Vice President for Research Technology, NYU IT und Chief Digital Officer, NYU Libraries. Ackerman ist für Services und Strategie im Bereich der Forschungstechnologie an der NYU zuständig. „Mit unserer neuen Infrastruktur hat es nur 30 Stunden gedauert.“ 

Der neue Supercomputer, so Ackerman, „ist bahnbrechend für uns − und für die ganze Welt.“ 

 

Auf dem Höhepunkt der COVID-19-Pandemie an der Ostküste ein Cluster für High-Performance Computing zu installieren, war jedoch keine leichte Aufgabe. Der Zugang, die Reisemöglichkeiten und die Kontaktmöglichkeiten mit dem Kunden waren eingeschränkt. Zwei tatkräftige Lenovo Techniker ließen sich dadurch jedoch nicht aufhalten. 

 

Im Juli fuhr Chris Eckhoff 24 Stunden von seinem Zuhause in Florida nach New York, um den Supercomputer zu installieren. Das sind mehr als 1.600 km! 

Vorgestellte Lösungen

Alt text

Lenovo für das Gesundheitswesen

Mehr erfahren

Alt text

Lenovo High-Performance Computing

Mehr erfahren

Alt text

End-to-End-Services

Mehr erfahren

Schließlich kam noch Chulho Kim dazu, ein weiterer langjähriger Mitarbeiter von Lenovo. Die beiden lebten monatelang im Hotel, um sicherzustellen, dass die Installation reibungslos über die Bühne geht. Sie verließen es nur für die Arbeit und um Essen zu besorgen. 

 

„Das war eine außergewöhnliche Zeit aufgrund außergewöhnlicher Umstände“, erinnert sich Eckhoff. „Aber wir konnten deswegen nicht einfach alles stehen und liegen lassen.“ 

 

Und die Installation war außergewöhnlich dringend. 

 

„Verzögerungen wären in diesem Fall einfach inakzeptabel gewesen“, fügt Ackerman hinzu. „Ich habe an Lenovo geschrieben: Wir brauchen diesen Supercomputer, und wir brauchen ihn jetzt, um der Welt zu helfen!“ 

Alt text

„Er musste einsatzbereit sein, weil viele der Wissenschaftler, die das System nutzten, mit der Erforschung von COVID beschäftigt waren“, so Scott Tease, General Manager, HPC and KI, Lenovo. „Die NYU hat Lenovo und andere Anbieter vor die Herausforderung gestellt, das System in solch schwierigen Zeiten zum Laufen zu bringen − und wir haben reagiert.“ 

 

Ein System von derartiger Größe und Komplexität in Zeiten wie diesen zusammenzustellen und zu versenden, ist nichts für schwache Nerven. Glücklicherweise wurde das Duo von den branchenweit besten globalen Lieferkettenteams von Lenovo unterstützt, die unermüdlich daran arbeiteten, den Supercomputer zusammenzubauen, im Werk zu testen und dann eine synchronisierte Ankunft im Rechenzentrum der NYU zu bewerkstelligen, pünktlich zum Starttermin.

 

Die NYU war von den Ergebnissen sehr beeindruckt. Zu den Dingen, die die Arbeit mit Lenovo besonders attraktiv machen, zählt für Ackerman das Angebot an Hochleistungsservern mit Lenovo Neptune™ Flüssigkühlung. Das System ist nicht nur umweltfreundlicher und kosteneffizienter als andere, sondern leistet auch mehr. 

 

„Unser ursprünglicher Rang in den TOP500 brachte uns eine Bewertung von 1,729 petaFLOP“, berichtet er. Das TOP500-Projekt ist eine Rangliste der 500 leistungsstärksten Supercomputer der Welt, deren Leistung in petaFLOP gemessen wird. Diese Zahl stieg auf 2,008, „allein durch die direkte Wasserkühlung“ − eine Verbesserung um 20 Prozent.

 

„Richtig gute Technologie ist angeblich wie Magie, und das hier ist wirklich magisch“, so Ackerman. 

 

Die Zauberer im Hintergrund waren Chulho Kim und Chris Eckhoff, die rund um die Uhr arbeiteten und all ihre Fachkenntnisse und Flexibilität für eine pünktliche Installation des Clusters einsetzten. 

Alt text

Der neue Supercomputer ist bahnbrechend für uns − und für die ganze Welt.

Üblicherweise kümmert sich ein Teammitglied ausschließlich um die Fehlerbehebung und die Ermittlung von Hardwareproblemen. „Das Schwierige daran ist, die Fehler zu finden: Warum ein bestimmter Knoten langsam läuft, obwohl die Netzwerkeinstellungen stimmen, und so weiter.“ Das Cluster ist nur so stark wie sein schwächstes Element, sodass sich selbst kleinere Probleme auf die Konfiguration auswirken.  

Doch dieses Mal musste er mehrere Funktionen auf einmal wahrnehmen, „Tests durchführen, Teile ersetzen“. Einen Supercomputer zu bauen, ist schließlich keine Kleinigkeit. Ein typischer Supercomputer benötigt mindestens Zehntausende parallel arbeitender Kerne. In einem solchen Gerät einen Fehler zu finden, sagt Chulho Kim, ist wie die berühmte Suche nach der Nadel im Heuhaufen.  

 

„Dieses Projekt war aus vielen Gründen eine echte Herausforderung“, fügt Chris Eckhoff hinzu. Normalerweise wird ein HPC-Cluster in enger Zusammenarbeit mit dem Kunden und einem zwei- bis dreiköpfigen Team installiert. Dieses Mal war alles anders. Doch Eckhoff ließ nicht locker, das Cluster wurde pünktlich fertig gestellt und die Forschung der NYU konnte ungehindert weiterlaufen. 

 

Kim sagt, er habe aus dieser Erfahrung gelernt, dass Erfolg auch dann möglich ist, wenn alles dagegen zu sprechen scheint. Zumindest sei ihm bewusst gewesen, dass er es versuchen musste. 

 

„Ich habe keine andere Möglichkeit gesehen“, sagt er.