Hot Chips 31: Startup Cerebras zeigt weltgrößten Chip mit 400.000 Rechenkernen
Im Zuge des aktuellen Hot Chips 31-Symposiums hat das Startup Cerebras einen Chip der Superlative vorgestellt. 46.225 mm² misst die Wafer Scale Engine (WSE), die mit 400.000 Rechenkernen ausgestattet ist und als KI-Beschleuniger dienen soll.
Eigentlich zeigt der Trend gerade bei komplexeren integrierten Schaltkreisen in Richtung modularer Aufbauten und bewegt sich vom monolithischen Ansatz weg. Doch das Startup Cerebras will sich dem nicht anschließen und präsentiert auf dem aktuellen Hot Chips 31-Symposium einen monolithischen Chips im XXL-Format.
Die sogenannte Wafer Scale Engine (WSE) stellt mit 46.225 mm² den weltgrößten Chip dar und vereint auf jener Fläche nicht nur 400.000 einzelne Rechenkerne, sondern auch 18 GiByte an SRAM. Insgesamt 1,2 Billionen Transistoren sind untergebracht und arbeiten als vollwertiger Prozessor.
Die WSE musste teilweise an die Gegebenheiten der Chipfertigung angepasst werden. Der monolithische Mega-Chip ist auf das größtmögliche Quadrat ausgelegt, das sich aus einem 300-mm-Wafer heraustrennen lässt. Zudem besteht er aus diversen baugleichen Abschnitten, die im Gegensatz zur üblichen Vorgehensweise nicht herausgeschnitten werden, sondern mittels Drahtbrücken im Verbund arbeiten.
Die Herstellungskosten werden zwar nicht explizit genannt, aber auf 15.000 US-Dollar pro Chip geschätzt und damit sehr hoch. Da das Aussortieren teildefekter Abschnitte nicht vorgesehen ist, haben die Entwickler zahlreiche Redundanzen implementiert, um einer Entsorgung des kompletten Chips entgegenzuwirken. Zusätzliche Kerne sollen in einem solchen Fall in den Verbund aufgenommen werden. Auch an anderen Stellen warten Hindernisse.
Thermischer Expansion wird etwa mit einer flexiblen Anbindung zwischen Silizium und PCB entgegengewirkt. Für die Kühlung baut das Startup derweil in die Senkrechte. Der verwendete Wasserkühlkreislauf transportiert die Kühlflüssigkeit durch eine auf dem Chip angebrachte Coldplate nach oben hin weg.
Auch lesenswert: Speicherkarten: Demo von neuer SD Express-Karte schafft knapp 820 MByte pro Sekunde
Laut Cerebras liege die zusammengenommene Bandbreite des Interconnects, das als 2D-Mesh ausgelegt ist und den Namen "Swarm" trägt, bei 100 PByte/s. Letztlich soll die Wafer Scale Engine als KI-Beschleuniger eingesetzt werden. Laut Cerebras komme der Chip bereits im Labor zum Einsatz und rechne kundenspezifische Modelle durch. Wie hoch der anfallende Stromverbrauch letztlich ausfällt, wollte das Startup nicht verraten.
Der optimale Videoschnitt-PC für Premiere & Co.: PCs für jeden Geldbeutel
mehr ...

Der gezeigte Chip ist wohl lauffähig, auch wenn er nicht öffentlich demonstriert wurde.
Hot Chips 31 Live Blogs: Cerebras' 1.2 Trillion Transistor Deep Learning Processor
Kühlung natürlich mittels Wasser, eine größere Herausforderung war aber die Stromversorgung. Aufgrund der im Vergleich zu Fläche und Transistorzahl geringen Kantenlängen sowie der großen Entfernungen kann man die benötigte Energie nicht von der Seite her durch ein PCB rantransportieren.
Der lauffähige Prototyp heist dann Skynet...
Zeigen sollten sie einen lauffähigen Prototypen. Alles andere ist für mich nur eine Studie bzw. Fakescheiße hoch zehn.