Nvidia Pascal: Whitepaper zu GP100 mit weiteren Details
Nvidia hat ein Whitepaper zum neuen Grafikchip GP100 mit Pascal-Architektur veröffentlicht, das viele weitere Details enthält, die bei der Präsentation nicht genannt wurden. Damit lässt sich die neue Architektur besser verstehen und auch die Gründe für manche Design-Entscheidung werden klarer.
Der GP100-Grafikchip ist aufgrund seines Designs und des Schwerpunkts auf Berechnungen in Double Precision keine GPU, die für den Desktop-Bereich gedacht ist. In einem Whitepaper zur Nvidia Tesla P100 hat das Unternehmen nun viele Details veröffentlicht, die auch etwas mehr zur Pascal-Architektur verraten.
Der GP100 verwendet nur 56 Streaming Multiprocessors (SM), obwohl auf dem Chip tatsächlich 60 SM vorhanden sind. Das ist vermutlich zur Absicherung einer ausreichenden Ausbeute bei der Produktion gedacht - oder erlaubt einfach etwas Luft nach oben. Bei der Pascal-Architektur besitzt ein SM 64 CUDA-Cores für Berechnungen mit Single Precision und damit deutlich weniger als Kepler mit 192 SM oder Maxwell mit 128 SM.
Die 64 CUDA-Cores sind in zwei 32er-Blöcke aufgeteilt, die je einen Befehlsbuffer, einen Warp-Scheduler und zwei Dispatch-Units besitzen. Trotz der kleineren Anzahl an SM bei Pascal ist der Registerspeicher ebenso groß wie bei Maxwell und erlaubt eine ähnliche Zahl an gleichzeitigen Warps und Threads.
Für Double Precision besitzt jeder SM 32 FP64-CUDA-Cores. Ein komplett freigeschalteter GP100 hätte also insgesamt 1.920 FP64-Einheiten. Das Verhältnis von 2:1 bei den Single-Precision-Einheiten und den Double-Precision-Einheiten soll besser zur neuen Konfiguration des Datenpfads des GP100 passen und damit für mehr Effizienz bei DP-Berechnungen sorgen.
Der L2-Cache des GP100 ist 4.096 KByte groß und damit auch größer als beim GM200 mit 3.072 KByte. Laut Nvidia werden so weniger Anfragen an den Videospeicher notwendig. Damit werden Energieverbrauch und die benötigte Speicherbandbreite verringert und gleichzeitig die Leistung erhöht.
