Cerebras WSE-3: Der größte Chip aller Zeiten ist ein GPU-Cluster

18
News Sven Bauduin Als bevorzugte Quelle auf Google hinzufügen
Cerebras WSE-3: Der größte Chip aller Zeiten ist ein GPU-Cluster
Quelle: Cerebras

Der Cerebras Waferscale Engine 3 ("WSE-3") ist der größte Computerchip aller Zeiten und soll so die Rechenleistung eines gesamten GPU-Clusters in einem Chip mit der Größe eines 300-mm-Wafers vereinen.

Insgesamt 90.000 Recheneinheiten und 44 GiB SRAM auf einer riesigen Fläche von 46.225 Quadratmillimetern, der Cerebras Waferscale Engine 3 ("WSE-3") ist in jeder Hinsicht beeindruckend. Der größte Computerchip aller Zeiten soll die Rechenleistung eines gesamten "GPU-Clusters" in einem Chip mit der Größe eines Wafers mit einem Durchmesser von 300 mm vereinen. Die "großzügige" Speicherausstattung wurde außerdem über den gesamten Computerchip verteilt, sodass auch die ebenso zahlreichen Recheneinheiten jeweils einzeln auf diesen zugreifen können.

Cerebras WSE-3 Quelle: Cerebras Das offizielle Datenblatt (PDF) verdeutlicht noch einmal die gewaltigen Ausmaße und technischen Spezifikationen, die selbst einen schon riesigen KI-Beschleuniger wie den Nvidia H100 winzig erscheinen lassen. Der Cerebras WSE-3 wirft mit Superlativen nur so um sich und läuft beim taiwanischen Auftragsfertiger TSMC in einer Node mit 5 Nanometern vom Band. Der Direktvergleich von Cerebras verdeutlicht nur noch einmal, um was für einen riesigen Monsterchip es sich hierbei handelt.

Cerebras WSE-3 Quelle: Cerebras Auch bei der Leistungsaufnahme respektive dem Verbrauch muss in ganz andere Spähren gedacht werden, denn der Waferscale Engine 3 nimmt bis zu 24 Kilowatt pro System an Leistung auf. Die Rechenleistung eines einzelnen Chips beträgt bis zu 125 PetaFLOPS, während laut Celebras in einem Verbund aus bis zu 2.000 Knoten bis zu 256 ExaFLOPS und 12 Petabyte SRAM realisierbar sind. Der Cloud-Anbieter G42 betreibt laut Cerebras bereits mehrere KI-Cluster mit WSE-3, welche eine Rechenleistung von bis zu 8 PetaFLOPS liefern sollen.

Empfohlener redaktioneller Inhalt [EMBED_URL] An dieser Stelle finden Sie externe Inhalte von [PLATTFORM]. Zum Schutz Ihrer persönlichen Daten werden externe Einbindungen erst angezeigt, wenn Sie dies durch Klick auf "Alle externen Inhalte laden" bestätigen: Ich bin damit einverstanden, dass mir externe Inhalte angezeigt werden. Damit werden personenbezogene Daten an Drittplattformen übermittelt. Mehr dazu in unserer Datenschutzerklärung.
Externe Inhalte Mehr dazu in unserer Datenschutzerklärung.

Weitere Informationen liefert die offizielle Website von Cerebras.

Ihre Meinung ist gefragt!

Wie stehen Sie zu diesem Thema? Die PCGH-Redaktion freut sich über Ihre fundierte Meinung in den Kommentaren zu dieser Meldung. Um zu kommentieren, müssen Sie auf PCGH.de oder im Extreme-Forum eingeloggt sein. Sollten Sie bisher noch keinen Account haben, könnten Sie sich hier unverbindlich registrieren. Beachten Sie beim Kommentieren aber bitte die geltenden Forenregeln.

Quelle: Cerebras via Golem

18
    • Kommentare (18)

      Zur Diskussion im Forum
      • Von PCGH_Torsten Kokü-Junkie (m/w)
        Ich weiß tatsächlich nicht, wie genau der Cerebras-Kühler aussieht. Aber mit Wasser ist das, bei dieser Fläche, kein Problem – wie schon mehrfach gesagt wurde. 24 kW klingen im Vergleich zu einem Gaming-PC nach viel, aber schon ein kleiner A1-Motorroller belastet seinen Kühlkreislauf stärker (wenn er nicht luftgekühlt wird). Das manch sparsamere PC-Komponente trotz Wasserkühlung heiß wird, liegt nicht an der Wärmemenge, sondern nur an der Wärmekonzentration. Also Heizleistung pro Fläche, aber hier ist der "Chip" ja noch viel riesiger als sein Verbrauch. Die Wärme von 100 i9-12900K (100× 241 W) auf der Fläche von 221 i9-12900K (221× 209 mm²) abzuführen ist ... "entspannt". Die Wärmedichte entspricht ziemlich exakt einem Ryzen 8000G.
      • Von PCGH_Torsten Kokü-Junkie (m/w)
        Ich weiß tatsächlich nicht, wie genau der Cerebras-Kühler aussieht. Aber mit Wasser ist das, bei dieser Fläche, kein Problem – wie schon mehrfach gesagt wurde. 24 kW klingen im Vergleich zu einem Gaming-PC nach viel, aber schon ein kleiner A1-Motorroller belastet seinen Kühlkreislauf stärker (wenn er nicht luftgekühlt wird). Das manch sparsamere PC-Komponente trotz Wasserkühlung heiß wird, liegt nicht an der Wärmemenge, sondern nur an der Wärmekonzentration. Also Heizleistung pro Fläche, aber hier ist der "Chip" ja noch viel riesiger als sein Verbrauch. Die Wärme von 100 i9-12900K (100× 241 W) auf der Fläche von 221 i9-12900K (221× 209 mm²) abzuführen ist ... "entspannt". Die Wärmedichte entspricht ziemlich exakt einem Ryzen 8000G.
      • Von AlphaMale Software-Overclocker(in)
        Irgendwie gehen bei soviel Rechenpower schon die Fantasie-"Anteile" auf Reisen.😁
        Was mich interessieren würde, wie KANN man solch ein Monster überhaupt kühlen? Legt man das in ein tiefgekühltes Ölbad? ( Natürlich nicht elektrisch Leitfähig.😎
      • Von gerX7a BIOS-Overclocker(in)
        [Ins Forum, um diesen Inhalt zu sehen]: Das ist ein 23 - 24 KW-Design. Selbst wenn betreffender Poster hätte durchblicken lassen, dass er/sie im Datacenter tätig ist, wäre die Aussage "entspannt kühlen" in diesem Kontext hier in diesem Forum dennoch vollkommender ******

        Darüber hinaus ist das Cerebras-Design immer noch als Spezial- bzw. Nischenlösung anzusehen. Das wird ebenso seine Kunden finden, ist aber ausnahmslos ein hochgradig spezialisierter ML-Chip und nicht mehr. nVidia's Tensor Cores alleine sind da schon wesentlich funktionsreicher und dazu kommt noch umfangreiche FP64-Funktionalität.
        Entsprechend dürfte vermutlich auch AMD insgesamt bessere Absatzaussichten mit seiner 300er-Generation haben als Cerebras im AI-Markt.
      • Von PCGH_Torsten Kokü-Junkie (m/w)
        Zitat von Christoph1717
        Auf dem Bild sieht man ein Gitter das aus 12x7 Blöcken besteht.
        Es währe sehr praktisch wenn in einem ein Produktiosfahler ist, den abzuschalten und der Rest kann dann genutzt werden.
        Zumindest bei WSE 1 und WSE 2 war die Redundanz auf niedriger Ebene organisiert. Wenn dieses Muster weiter genutzt wird (und davon gehe ich aus) hat man im Prinzip 12 × 7 getrennt gefertigte (!) Chips, die sich jeweils aus einer großen Zahl aktiver und einer kleinen Zahl deaktivierter oder eben defekter Kerne zusammensetzen und die untereinander durch nachträglich aufgebrachte Verbindungen auf dem Wafer vernetzt werden. Auch Cerebras kann keine größeren Bereiche am Stück ausbelichten, als aktueller Anlagen zulassen, sondern verzichtet einfach darauf, den Wafer am Ende der Produktion in einzelne Chips zu zersägen. Ob der Marketing-Claim des größten Einzel-Chips überhaupt gerechtfertigt werden kann, ist daher umstritten. Die eigentlich Besonderheit liegt in der Integration großer Mengen Speicher, die eine Aufteilung (um z.B. HBM rund um die Einzel-Chips zu platzieren) überflüssig macht.

        Zitat von gerX7a
        "Entspannt" lässt sich da mal gar nichts kühlen, erst recht nicht in diesem Kontext hier. Das ist ein reines Datacenterprodukt und mit 15 Höheneinheiten ist das auch kein kleines Package.

        Zum Kontext für Dritte ... eine solche zieht in etwa so viel wie rund 40 bis 60 HighEnd-PCs im Gaming.
        Die Wärmeabgabe an die Umgebung braucht natürlich weiterhin Kapazitäten entsprechend der Gesamtleistung und gleiches gilt für die Stromversorgung. Würde man beides sowie sämtliche für den Datenverkehr nötigen Zusatzeinheiten in getrennte Module auslagern, wie das bei immer mehr konventionellen Servern praktiziert wird, spräche aber eigentlich nichts gegen ein 1U-Dual- oder gar -Quad-WSE-Rack. Die Leistungsdichte ist tatsächlich angenehm niedrig und die Wärmeaufnahme vom Chip, die bei Desktop-Hardware so viele Sorgen bereitet, sollte entsprechend "entspannt" sein.

        Allerdings wird kaum jemand Cerebras kaufen, wenn seine Aufgabenstellung auf mehrere Systeme verteilt berechnet werden kann, sodass sich eine zentrale Infrastruktur für multiple Einheiten lohnen würde. Da ist der Verkauf als Single-WSE-Komplettlösung einfach ökonomisch sinnvoller, auch wenn es technisch viele Alternativen gäbe.
      • Von RyzA Flüssigstickstoff-Guru (m/w)
        Hier stand Unsinn. Sorry.
      Direkt zum Diskussionsende
  • Print / Abo
    Apps
    PCGH Magazin 07/2026 PC Games 07/2026 play5 07/2026 N-Zone 07/2026 Linux Magazin 07/2026 LinuxUser 07/2026 Raspberry Pi Geek 07/2026
    PC Games Hardware PC Games Linux Magazin Raspberry Pi Geek Computec Kiosk