Nvidia Pascal: Whitepaper zu GP100 mit weiteren Details

13
News George J. King Als bevorzugte Quelle auf Google hinzufügen
Nvidia hat ein Whitepaper zur Tesla P100 mit vielen Details veröffentlicht.
Quelle: Nvidia

Nvidia hat ein Whitepaper zum neuen Grafikchip GP100 mit Pascal-Architektur veröffentlicht, das viele weitere Details enthält, die bei der Präsentation nicht genannt wurden. Damit lässt sich die neue Architektur besser verstehen und auch die Gründe für manche Design-Entscheidung werden klarer.

Der GP100-Grafikchip ist aufgrund seines Designs und des Schwerpunkts auf Berechnungen in Double Precision keine GPU, die für den Desktop-Bereich gedacht ist. In einem Whitepaper zur Nvidia Tesla P100 hat das Unternehmen nun viele Details veröffentlicht, die auch etwas mehr zur Pascal-Architektur verraten.

Der GP100 verwendet nur 56 Streaming Multiprocessors (SM), obwohl auf dem Chip tatsächlich 60 SM vorhanden sind. Das ist vermutlich zur Absicherung einer ausreichenden Ausbeute bei der Produktion gedacht - oder erlaubt einfach etwas Luft nach oben. Bei der Pascal-Architektur besitzt ein SM 64 CUDA-Cores für Berechnungen mit Single Precision und damit deutlich weniger als Kepler mit 192 SM oder Maxwell mit 128 SM.

Die 64 CUDA-Cores sind in zwei 32er-Blöcke aufgeteilt, die je einen Befehlsbuffer, einen Warp-Scheduler und zwei Dispatch-Units besitzen. Trotz der kleineren Anzahl an SM bei Pascal ist der Registerspeicher ebenso groß wie bei Maxwell und erlaubt eine ähnliche Zahl an gleichzeitigen Warps und Threads.

Für Double Precision besitzt jeder SM 32 FP64-CUDA-Cores. Ein komplett freigeschalteter GP100 hätte also insgesamt 1.920 FP64-Einheiten. Das Verhältnis von 2:1 bei den Single-Precision-Einheiten und den Double-Precision-Einheiten soll besser zur neuen Konfiguration des Datenpfads des GP100 passen und damit für mehr Effizienz bei DP-Berechnungen sorgen.

Der L2-Cache des GP100 ist 4.096 KByte groß und damit auch größer als beim GM200 mit 3.072 KByte. Laut Nvidia werden so weniger Anfragen an den Videospeicher notwendig. Damit werden Energieverbrauch und die benötigte Speicherbandbreite verringert und gleichzeitig die Leistung erhöht.

13
    • Kommentare (13)

      Zur Diskussion im Forum
      • Von DBGTKING
        Cool und wie verhält such der größere cache und schneller speicher bei höhere auflösung. Bestimmt genauso. So Oder so sehe ich da sehr gut in die zukunft. Weil irgendwann wir mal Meine titan 1 auch ersetzt werden damit ich endlich mal bei 4k 60 fps und nicht nur 40 fps habe. Darum habe ich ja gefragt gehabt.
      • Von DBGTKING
        Cool und wie verhält such der größere cache und schneller speicher bei höhere auflösung. Bestimmt genauso. So Oder so sehe ich da sehr gut in die zukunft. Weil irgendwann wir mal Meine titan 1 auch ersetzt werden damit ich endlich mal bei 4k 60 fps und nicht nur 40 fps habe. Darum habe ich ja gefragt gehabt.
      • Von PCGH_Carsten Volt-Modder(in)
        Der Cache pro Speichercontroller ist im Vergleich zum GM200 beim GP100 gleichgeblieben (512 kiB) - von daher ist es unwahrscheinlich, dass bei den Gaming-Ablegern in Relation größere Caches zum Einsatz kommen. Allerdings ist der Speicher „dahinter“ zumindest beim GP100 wesentlich flotter und allein das sollte bei Multisample-Kantenglättung helfen.
      • Von ZeroCool261 Freizeitschrauber(in)
        Zitat von Milkyway
        Cache bringt dir grundsätzlich mehr Leistung. Das is mehr oder weniger wie beim Arbeitsspeicher und der Auslagerungsdatei: Alles im Cache ist schön schnell, muss was aus dem VRAM geholt werden wird gewartet. Heißt also, dass wenn mehr in den Cache passt, die GPU weniger warten muss und somit besser ausgelastet wird.
        Der Cache bringt dir aber nur was, wenn du mehrmals auf die Daten zugreifen kannst bzw. musst, einmal müssen die Daten sowieso geladen werden aus dem Arbeitsspeicher. Wenn du z.B. weißt auf welche Daten du zugreifen wirst in der Zukunft dann vielleicht auch aber irgendwann ist da auch Schluss.
      • Von Milkyway PC-Selbstbauer(in)
        Zitat von DBGTKING
        Na das habe ich anders gemeint.Die neuen Grafikkarten werden sicherlich auch mehr L2 Cache bekommen.Die Frage war also allgemein bezogen gewesen.Ob mehr L2 Cache bei Kantenglättung vorteile bringen kann.Aber naja egal wir haben halt aneinander vorbei geschrieben.Warscheinlich wird es bei so eienr berechnung keine Rolle spielen wie gut es die bandbreite entlastet.Die GPU wird eh immer überlastet sein für sowas.Kann sein das ich das auch falsch rüber gebracht habe,ist aber dann auch egal,ist wohl von mir falsch Formuliert.
        Cache bringt dir grundsätzlich mehr Leistung. Das is mehr oder weniger wie beim Arbeitsspeicher und der Auslagerungsdatei: Alles im Cache ist schön schnell, muss was aus dem VRAM geholt werden wird gewartet. Heißt also, dass wenn mehr in den Cache passt, die GPU weniger warten muss und somit besser ausgelastet wird.
      • Von DBGTKING
        Na das habe ich anders gemeint.Die neuen Grafikkarten werden sicherlich auch mehr L2 Cache bekommen.Die Frage war also allgemein bezogen gewesen.Ob mehr L2 Cache bei Kantenglättung vorteile bringen kann.Aber naja egal wir haben halt aneinander vorbei geschrieben.Warscheinlich wird es bei so eienr berechnung keine Rolle spielen wie gut es die bandbreite entlastet.Die GPU wird eh immer überlastet sein für sowas.Kann sein das ich das auch falsch rüber gebracht habe,ist aber dann auch egal,ist wohl von mir falsch Formuliert.
      Direkt zum Diskussionsende
  • Print / Abo
    Apps
    PCGH Magazin 07/2026 PC Games 06/2026 play5 07/2026 N-Zone 06/2026 Linux Magazin 06/2026 LinuxUser 06/2026 Raspberry Pi Geek 07/2026
    PC Games Hardware PC Games Linux Magazin Raspberry Pi Geek Computec Kiosk