Nvidia GP100: Die-Shot zeigt die bislang komplexeste GPU
Im Rahmen der Hot Chips hat Nvidia einen Die-Shot seiner GP100-GPU gezeigt. Es handelt sich um den bislang komplexesten Grafikchip mit 15,3 Milliarden Transistoren, die in 610 mm² in TSMCs 16FF+-Fertigungsverfahren untergebracht werden. Die Shader-Multiprozessoren nehmen dabei recht wenig Platz ein.
In den vergangenen Jahren wurden offizielle Die-Shots von AMD und Nvidia immer seltener. Vor allem der Aufbau der großen GPUs soll ein gut gehütetes Geheimnis bleiben. Im Falle des GP100 hat Nvidia nun allerdings einen Die-Shot veröffentlicht, der einige Details über den 610 mm² großen Grafikchip verrät. Leider ist die Fotografie noch ziemlich unsauber und offenbar etwas nachbearbeitet. Die Shader-Multiprozessoren, kurz SMs, sind beispielsweise in dunklerem Grün hervorgehoben.
Interessanterweise spricht Nvidia auf der Hot Chips nur noch von 30 statt 60 SMs. Auf dem Die-Shot zeigt sich jedoch, dass alle der 30 Blöcke in sich nahezu gespiegelt sind, also zwei SMs jeweils zusammengefasst wurden. Geht man von der 60er-Zählung aus, besteht ein SM aus 64 FP32-Einheiten, die FP16-Berechnungen in doppelter Rate durchführen können, sowie 32 FP64-Einheiten. Daraus ergibt sich das 4:2:1-Verhältnis zwischen Half-, Single- und Double-Precision. Die SMs nehmen nur gut ein Drittel der gesamten Chipfläche ein. Das 3DCenter-Mitglied Triskaine kommt anhand des Die-Shots auf eine Fläche von etwa 220 mm² für die SMs. Ein 64-ALU-SM ist etwa 3,6 bis 3,7 mm² groß. Zum Vergleich: Auf Polaris 10 ist eine Compute Unit mit 64 Shadern knapp 3 mm² groß, beherrscht dort allerdings keine Double-Precision in halber Rate. Nvidia investiert vor allem in das "Drumherum" deutlich mehr Chipfläche, um die Auslastung der Shader-Cluster zu verbessern. Die mittig sitzende "Gigathread Engine", welche die sechs Graphics Processing Clusters (GPCs) mit Aufgaben füttert, etwa fällt geradezu riesig aus.
Gut auszumachen sind oben und unten an den Rändern die HBM2-Speicherinterfaces. Interessante Randnotiz: Die Webseite anandtech.com konnte ein mutmaßlich finales GP100-Package auf der Hot Chips fotografieren. Die HBM-Stacks wurden fast lückenlos neben der GPU positioniert, um möglichst wenig Platz auf dem Silizium-Interposer einzunehmen. Fijis Interposer ist 1.011 mm² groß - Jener vom GP100 wird wegen der größeren GPU (610 vs. 596 mm²) und der größeren HBM2- statt HBM1-Stacks (91,99 vs. 39,94 mm²) noch größer ausfallen.

Gibts eigentlich einen Chip mit einer höheren Transistorenanzahl als den GP100, oder ist das Weltrekord?
Also RAM zum Beispiel, aber halt keine Logik
Du hast es vielleicht nicht Mitbekommen weil PCGH noch keinen Test dazu gebracht hat. Es gab zu wenig Testkarten für Deutschland.