Hardware Dienstag mit AI Supercomputern. Intel, Microsoft, AMD und andere wetteifern um den besten Super-Computer für AI-Anwendungen der Zukunft. Es wurde allgemein erwartet, dass der von Intel betriebene Supercomputer Aurora dem von AMD betriebenen Frontier, dem aktuellen Spitzenreiter der Top500-Liste, den Spitzenplatz streitig machen würde, doch stattdessen belegte er den zweiten Platz. Aurora belegte jedoch den ersten Platz im KI-zentrierten HPL-MxP-Benchmark im mixed-precision-benchmark, so dass Intel mit einer Leistung von 10,6 KI-Exaflops den Anspruch erheben kann, den schnellsten KI-Supercomputer der Welt zu betreiben. (1)
Dazu muss man wissen, dass Aurora noch immer nicht voll einsatzfähig ist, so dass das gesamte System für keinen der eingereichten Benchmarks verwendet wurde. Bei Aurora kämpft Intel aber auch mit zahlreichen Hardware-Problemen, wie zum Beispiel Ausfälle in der Kühlung und im Netzwerk. Die anhaltenden Probleme sind etwas überraschend – das System wurde erstmals vor neun Jahren angekündigt. Nachdem diese eingestellt wurde, folgte vor fünf Jahren eine zweite Revision. Letzte Komponenten wurden vor elf Monaten installiert.
Das System beherbergt 21.248 CPUs und 63.744 GPUs, die auf 10.624 Compute-Blades verteilt sind, aber das Argonne National Laboratory (ANL), das das System hostet, war erneut nicht in der Lage, einen vollständigen Linpack-Lauf für die Top500-Liste einzureichen. Neu auf der Liste der Top-500-Supercomputer ist der im National Composites Centre (NCC) der Universität Bristol untergebrachte Isambard-AI auf Platz 128. Der 225 Millionen-Pfund teure Rechner (273 Mio Euro) belegte auch den zweiten Platz auf der Green500-Liste, einer Liste, die Supercomputer nach ihrer Energieeffizienz einstuft, mit einem Wert von 68,8 Gigaflops pro Watt. (2)
Aufgebaut auf einem HPE Cray EX-basierten System, wird Isambard-AI bei voller Kapazität 5.448 Nvidia GH200 Superchips enthalten und 200 Petaflops Linpack und 21 Exaflops an KI-Rechenleistung bieten. In der ersten Ausbaustufe bietet die Maschine derzeit 7,4 Petaflops Linpack und 647 Petaflops KI-Rechenleistung auf 168 GPUs. Die verbleibenden 5.280 Nvidia GH200 Superchips sollen noch in diesem Sommer im NCC eintreffen, um die volle Kapazität von Isambard-AI zu erreichen.
Das System umfasst auch HPE Slingshot 11 Interconnect, fast 25 Petabyte Speicher mit dem Cray Clusterstor E1000 und wird in einem selbstgekühlten, in sich geschlossenen Rechenzentrum mit dem HPE Performance Optimized Data Center (POD) gehostet. Ein Wärmerückgewinnungssystem leitet die Abwärme in nahegelegene Gebäude. Isambard-AI wird schließlich mit dem Supercomputer-Cluster Dawn an der Universität Cambridge verbunden werden. Dieses System, das das Ergebnis einer zweijährigen Zusammenarbeit zwischen Dell und Intel ist, wurde im Februar in Betrieb genommen. Dawn, das sich ebenfalls noch in der ersten Phase befindet, bietet derzeit eine FP64-Leistung von 19 Petaflops.
In anderen Nachrichten (3) investiert Microsoft bis zu 4 Milliarden Euro in ein KI-Rechenzentrum im französischem Mulhouse.
[ 1, 2, 3 ]