KI-Server: Nvidias Blackwell-Monster NVL72 leidet unter Überhitzungsproblemen

2
News Jusuf Hatic Als bevorzugte Quelle auf Google hinzufügen
KI-Server: Nvidias Blackwell-Monster NVL72 leidet unter Überhitzungsproblemen
Quelle: Nvidia

Nvidias Blackwell-Generation ist im Serverbereich weiter von Hindernissen betroffen. Nach der Produktionsverzögerung tauchen nun Berichte über Überhitzungsprobleme auf, die die GB200 NVL72-Systeme plagen.

Nvidia hat in diesem Quartal offiziell mit der Auslieferung der Blackwell-Beschleuniger begonnen, nachdem im vergangenen Monat ein Designfehler der GPUs zu einer schlechten Ausbeute und entsprechenden Verzögerung der Produktion geführt hatte. Nun tauchen allerdings weitere Probleme rund um das GB200 NVL72-System auf, wie das Branchenportal The Information berichtet. So soll der aus 36 Grace-CPUs und 72 Blackwell-GPUs bestehende Server unter Überhitzungsproblemen leiden.

Nvidia ist sich dem Bericht zufolge der Problematik bewusst und habe bereits verschiedene Designänderungen in Auftrag gegeben, um der Überhitzung entgegenzuwirken. Dennoch sollen sich die Abnehmer der NVL72-Systeme, etwa Google, Meta oder Microsoft, um eine pünktliche Lieferung und Einrichtung der Blackwell-Server in deren Datenzentren sorgen. Nvidia selbst äußerte sich gegenüber dem Magazin Reuters mit beschwichtigenden Worten, ohne genauer auf die Überhitzungsberichte einzugehen:

Nvidia arbeitet mit führenden Cloud-Service-Anbietern zusammen, die ein integraler Bestandteil unseres Entwicklungsteams und -prozesses sind. Die technischen Iterationen sind normal und zu erwarten.

Ein einzelnes Serverrack soll über eine Leistungsaufnahme von bis zu 120 kW verfügen, von denen rund 97,2 kW für die 36 Grace-Blackwell-Superchips benötigt werden. Die restlichen rund 22,8 kW entfallen wiederum auf die NVLink- sowie Netzwerk-Switches für die Kommunikation. Ein möglicher Lösungsansatz für die Eindämmung der Kühlungsprobleme wäre etwa eine Reduzierung der konfigurierbaren TDP einer einzelnen Blackwell-GPU, die bei bis zu 2.700 Watt liegt. Damit würde allerdings auch eine - für Nvidia wohl nicht zumutbare - Reduktion der Leistung einhergehen. Welche Designänderungen am Rack entsprechend vorgenommen wurden, um weder auf Leistung noch auf Kühlung zu verzichten, erklärte der Hersteller allerdings nicht.

2
    • Kommentare (2)

      Zur Diskussion im Forum
      • Von Just_osi Freizeitschrauber(in)
        Zitat von SFT-GSG
        Ich meine woanders gelesen zu haben, dass Nvidia das schon länger weiß. Sie haben die rack Hersteller angewiesen weniger Plätze pro rack zu Verfügung zu stellen, damit die Kühlung besser funktioniert. Aber die Hersteller halten sich nicht daran.
        Wer soviel Geld Verlangt soll gefälligst es auch hin bekommen. Wäre ja recht dumm als Kunde sich selber Beine zu stellen und Nvidia kassiert mit wucher preisen ab

        Vll helfen ja Abos 5 Grad weniger = 10k mehr
      • Von Just_osi Freizeitschrauber(in)
        Zitat von SFT-GSG
        Ich meine woanders gelesen zu haben, dass Nvidia das schon länger weiß. Sie haben die rack Hersteller angewiesen weniger Plätze pro rack zu Verfügung zu stellen, damit die Kühlung besser funktioniert. Aber die Hersteller halten sich nicht daran.
        Wer soviel Geld Verlangt soll gefälligst es auch hin bekommen. Wäre ja recht dumm als Kunde sich selber Beine zu stellen und Nvidia kassiert mit wucher preisen ab

        Vll helfen ja Abos 5 Grad weniger = 10k mehr
      • Von SFT-GSG BIOS-Overclocker(in)
        Ich meine woanders gelesen zu haben, dass Nvidia das schon länger weiß. Sie haben die rack Hersteller angewiesen weniger Plätze pro rack zu Verfügung zu stellen, damit die Kühlung besser funktioniert. Aber die Hersteller halten sich nicht daran.
      Direkt zum Diskussionsende
  • Print / Abo
    Apps
    PCGH Magazin 07/2026 PC Games 07/2026 play5 07/2026 N-Zone 07/2026 Linux Magazin 07/2026 LinuxUser 07/2026 Raspberry Pi Geek 07/2026
    PC Games Hardware PC Games Linux Magazin Raspberry Pi Geek Computec Kiosk