Cerebras WSE-3: Der größte Chip aller Zeiten ist ein GPU-Cluster
Der Cerebras Waferscale Engine 3 ("WSE-3") ist der größte Computerchip aller Zeiten und soll so die Rechenleistung eines gesamten GPU-Clusters in einem Chip mit der Größe eines 300-mm-Wafers vereinen.
Insgesamt 90.000 Recheneinheiten und 44 GiB SRAM auf einer riesigen Fläche von 46.225 Quadratmillimetern, der Cerebras Waferscale Engine 3 ("WSE-3") ist in jeder Hinsicht beeindruckend. Der größte Computerchip aller Zeiten soll die Rechenleistung eines gesamten "GPU-Clusters" in einem Chip mit der Größe eines Wafers mit einem Durchmesser von 300 mm vereinen. Die "großzügige" Speicherausstattung wurde außerdem über den gesamten Computerchip verteilt, sodass auch die ebenso zahlreichen Recheneinheiten jeweils einzeln auf diesen zugreifen können.
Quelle: Cerebras
Das offizielle Datenblatt (PDF) verdeutlicht noch einmal die gewaltigen Ausmaße und technischen Spezifikationen, die selbst einen schon riesigen KI-Beschleuniger wie den Nvidia H100 winzig erscheinen lassen. Der Cerebras WSE-3 wirft mit Superlativen nur so um sich und läuft beim taiwanischen Auftragsfertiger TSMC in einer Node mit 5 Nanometern vom Band. Der Direktvergleich von Cerebras verdeutlicht nur noch einmal, um was für einen riesigen Monsterchip es sich hierbei handelt.
Quelle: Cerebras
Auch bei der Leistungsaufnahme respektive dem Verbrauch muss in ganz andere Spähren gedacht werden, denn der Waferscale Engine 3 nimmt bis zu 24 Kilowatt pro System an Leistung auf. Die Rechenleistung eines einzelnen Chips beträgt bis zu 125 PetaFLOPS, während laut Celebras in einem Verbund aus bis zu 2.000 Knoten bis zu 256 ExaFLOPS und 12 Petabyte SRAM realisierbar sind. Der Cloud-Anbieter G42 betreibt laut Cerebras bereits mehrere KI-Cluster mit WSE-3, welche eine Rechenleistung von bis zu 8 PetaFLOPS liefern sollen.
Weitere Informationen liefert die offizielle Website von Cerebras.
Ihre Meinung ist gefragt!
Wie stehen Sie zu diesem Thema? Die PCGH-Redaktion freut sich über Ihre fundierte Meinung in den Kommentaren zu dieser Meldung. Um zu kommentieren, müssen Sie auf PCGH.de oder im Extreme-Forum eingeloggt sein. Sollten Sie bisher noch keinen Account haben, könnten Sie sich hier unverbindlich registrieren. Beachten Sie beim Kommentieren aber bitte die geltenden Forenregeln.
Quelle: Cerebras via Golem

Was mich interessieren würde, wie KANN man solch ein Monster überhaupt kühlen? Legt man das in ein tiefgekühltes Ölbad? ( Natürlich nicht elektrisch Leitfähig.😎
Darüber hinaus ist das Cerebras-Design immer noch als Spezial- bzw. Nischenlösung anzusehen. Das wird ebenso seine Kunden finden, ist aber ausnahmslos ein hochgradig spezialisierter ML-Chip und nicht mehr. nVidia's Tensor Cores alleine sind da schon wesentlich funktionsreicher und dazu kommt noch umfangreiche FP64-Funktionalität.
Entsprechend dürfte vermutlich auch AMD insgesamt bessere Absatzaussichten mit seiner 300er-Generation haben als Cerebras im AI-Markt.
Es währe sehr praktisch wenn in einem ein Produktiosfahler ist, den abzuschalten und der Rest kann dann genutzt werden.
Zum Kontext für Dritte ... eine solche zieht in etwa so viel wie rund 40 bis 60 HighEnd-PCs im Gaming.
Allerdings wird kaum jemand Cerebras kaufen, wenn seine Aufgabenstellung auf mehrere Systeme verteilt berechnet werden kann, sodass sich eine zentrale Infrastruktur für multiple Einheiten lohnen würde. Da ist der Verkauf als Single-WSE-Komplettlösung einfach ökonomisch sinnvoller, auch wenn es technisch viele Alternativen gäbe.