Nvidia GB200 ("Grace Blackwell"): Superchip für Supercomputer mit 13,5 Terabyte HBM3e-Speicher
Im Rahmen der hauseigenen KI- und Entwicklerkonferenz GTC 2024 hat Nvidia neben der neuen Dual-Die-GPU Nvidia B200 auch den darauf basierenden Superchip GB200 ("Grace Blackwell") mit Grace-CPU für KI-Supercomputer vorgestellt.
Nvidia hat im Rahmen seiner hauseigenen KI-Entwicklerkonferenz GTC 2024 neben der neuen Dual-Die-GPU Nvidia B200 ("Blackwell") auch den auf dieser Grafiklösung basierenden riesigen Superchip GB200 ("Grace Blackwell") mit Grace-CPU für den hauseigenen NVL72-Supercomputer sowie Kundenlösungen vorgestellt. Die technischen Spezifikationen lesen sich einmal mehr beeindruckend.
1 × Grace-GPU + 2 × Blackwell-GPU = Grace Blackwell
Der offiziell als GB200 Grace Blackwell Superchip vermarktete Hybrid-Lösung basiert auf einer Grace-CPU mit insgesamt 72 ARM Neoverse V2 Prozessorkernen und zwei Blackwell-GPUs sowie bis zu 384 GiByte HBM3e und 480 GiByte LPDDR5X, was in Nvidias hauseigenem NVL72-Supercomputer in äußerst beeindruckenden technischen Spezifikationen resultiert, welche sich wie folgt lesen.
- 36 Nvidia Grace-CPUs
- 2.592 ARM Neoverse V2 Prozessorkerne
- Bis zu 17 Terabyte LPDDR5X-Arbeitsspeicher
- 72 Blackwell-GPUs mit 13,5 Terabyte HBM3e-Speicher
- FP4-Rechenleistung: Bis zu 1.440 PetaFLOPS
- FP8-Rechenleistung: Bis zu 720 PetaFLOPS
- NVLink: Bis zu 130 TB/s an Bandbreite
Da der Nvidia B200 ("Blackwell") aus insgesamt zwei Dies besteht, stehen jedem GB200-Superchip ("Grace Blackwell") somit vier GPU-Dies zur Verfügung, dem neuen Supercomputer NVL72 somit respektive insgesamt 144 Blackwell-Dies.
Dabei verhält sich der gesamte Supercomputer "wie ein einziger massiver Grafikprozessor", so Nvidias CEO Jensen Huang im Rahmen der Vorstellung während der Keynote zur GTC 2024.
GB200 NVL72 verbindet 36 Grace-CPUs und 72 Blackwell-GPUs in einem Rack-Scale-Design. Der GB200 NVL72 ist eine flüssigkeitsgekühlte Lösung in einem Rack-Maßstab mit einer 72-GPU-NVLink-Domäne, welche wie ein einziger massiver Grafikprozessor funktioniert und eine bis zu 30-fach schnellere Rechenleistung in Echtzeit für eine LLMs-Inference mit mehreren Billionen von Parametern liefert.
- Nvidia -
Laut Nvidia sind Unternehmen wie Amazon, Dell, Google, Microsoft, OpenAI und Tesla bereits an entsprechenden Lösungen interessiert.
Quelle: Nvidia
Weitere Informationen hat Nvidia auf seinem hauseigenen Technical Blog sowie der offiziellen Website zusammengefasst.
Ihre Meinung ist gefragt!
Wie stehen Sie zu diesem Thema? Die PCGH-Redaktion freut sich über Ihre fundierte Meinung in den Kommentaren zu dieser Meldung. Um zu kommentieren, müssen Sie auf PCGH.de oder im Extreme-Forum eingeloggt sein. Sollten Sie bisher noch keinen Account haben, könnten Sie sich hier unverbindlich registrieren. Beachten Sie beim Kommentieren aber bitte die geltenden Forenregeln.
Quelle: Nvidia

Kräht der Hahn auf dem Mist ändert sich das Wetter oder es bleibt wie es ist.
Ganz ohne Supercomputer erstellt.
Das sind völlig verschiedene Ansätze und Produkte.
Wie schnell und teuer eine 5090 wird hängt hauptsächlich von Marktumgebung und Konkurrenz ab, nicht von der Technik. Nvidia könnte eine 5090 bringen die eine 4090 um Faktor 2 und mehr schägt und die für 1000€ verkaufen. Nur - wieso sollten sie das tun? Um sich selbst Konkurrenz zu machen und Geld zu verschenken?
Dann benutzt man lieber kleinere und/oder teildeaktivierte Chips um Endkundenbereich, verkauft die für 2000 und die vollaktiven als Profikarte für 10.000. Die 5090 wird dann vielleicht "nur" 40-50% schneller als der Vorgänger aber seitens AMD gibts da absehbar nichts also gibts auch keinen Grund da irre zu pushen oder irgendwas günstig anzubieten.
Sollte AMD später irgendwann doch nahekommen kann man beliebig eine 5090Ti nachschieben die dann mehr aktive SM hat und wieder vorlegen. Oder wenn das nicht passiert (wie beispielsweise jetzt) braucht man das halt nicht zu machen und verkauft weiter teildefekte Chips als Top-Karte. Deswegen gibts keine 4090Ti oder SUPER.