Nvidia Pascal: Folie zeigt GP100 mit 12 TFLOPS SP und 4 TFLOPS DP

107
News Mark Mantel Als bevorzugte Quelle auf Google hinzufügen
Nvidia Pascal: Folie zeigt GP100 mit 12 TFLOPS SP und 4 TFLOPS DP (2)
Quelle: Nvidia

Aktuell machen mehrere Präsentationen von Nvidia-Partnern die Runde, die Details zum GP100-Grafikchip zeigen, allerdings noch von 2014 beziehungsweise 2015 stammen. Genannt werden 12 TFLOPS Single-Precision-Leistung und 4 TFLOPS Double-Precision-Leistung. Je nach Takt wären damit 6.144 oder 5.120 Shadereinheiten denkbar.

Im 3DCenter wurde eine Präsentationsfolie ausfindig gemacht, die von CUDA-Fellow Manuel Ujaldon stammt, einem spanischen Universitätsprofessor mit einem eigenen Profil auf Nvidias offizieller Webseite. Gezeigt wird ein Vergleich der Single- und Double-Precision-Leistung sowie der Bandbreite zwischen Fermi, Kepler, Pascal und einigen konkurrierenden Plattformen von AMD und Intel. Erstellt wurde die Folie bereits im April 2014, von Ujaldon im Juni 2015 dann allerdings wieder verwendet. Da er offensichtlich Beziehungen zu Nvidia hat, sind die Informationen zumindest "semioffiziell".

Genannt werden indes 12 SP-TFLOPS und 4 DP-TFLOPS. Der 3:1-Teiler spricht erneut für den Einsatz von dedizierten FP64-Einheiten, um die Double-Precision-Operationen durchzuführen. Der Mixed-Precision-Ansatz würde damit nur für die halbe und einfache Genauigkeit (Half-, Single-Precision) gelten, bei denen zwei FP16-Einheiten für eine SP-Operationen zusammengeschaltet werden. Ansonsten müsste das HP-SP-DP-Verhältnis bei 4:2:1 und die DP-Leistung entsprechend bei 6 TFLOPS liegen. Um die genannten 12 TFLOPS zu erreichen, bräuchte es im Übrigen beispielsweise 6.144 Shadereinheiten bei einem Takt von knapp 1.000 MHz oder 5.120 bei 1.175 MHz. Ersterer Fall wäre quasi ein doppelter GM200 (3.072 Shader), würde in Anbetracht der jetzt wieder hinzugekommenen DP-Leistung aber sicher an die Grenzen des 16-nm-Prozesses gehen. Um noch Plätz für eine zweite 16-nm-Auflage zu lassen und in Anbetracht der geringeren Ausbeute einhergehend mit höheren Fertigungskosten, erscheint uns die 5.120-Shader-Variante für den Anfang realistischer.

Interessant ist derweil, dass wiederholt Hybrid Memory Cubes, kurz HMCs, als Speichertechnologie angesprochen werden, obwohl zuletzt immer die Rede von HBM war. Möglicherweise plante Nvidia im Frühjahr 2014 noch mit der Micron-Speicher-Technologie und Ujaldon hat ein entsprechendes Update verpasst. Andererseits könnte es sich beim GP100 immer noch um einen reinen HPC-Grafikchip auf Basis der Nvidia-Architektur handeln, bei dem die latenzoptimierten HMCs zum Einsatz kommen. Der GP102 als etwaige Gamer-Variante ohne große DP-Funktionalität wäre dann weiterhin mit HBM denkbar - wenn auch das Entwickeln von gleich zwei neuen Speicherinterfaces sicherlich nicht ohne Risiko wäre.

Die Präsentationen prognostizieren den GP100 übrigens weiterhin für den Sommer 2016. Damit wird einmal mehr deutlich, dass Nvidia schnellstmöglich den HPC-Markt versorgen möchte, der wegen der fehlenden DP-Performance von Maxwell noch auf Kepler setzen muss. Das französische Institut für alternative Energien und Kernenergie (CEA) und das Rechenzentrum für Forschung und Technologie (CCRT) haben bereits bekannt gegeben, ab Juli ein neues Rechenzentrum mit Pascal-GPUs aufbauen zu wollen. Das heißt allerdings nicht, dass auch Endkunden dieses Jahr schon eine solch große GPU zu Gesicht bekommen werden - in der Tesla- und Quadro-Sparte lassen sich die hohen Kosten deutlich besser absetzen.

Quelle: 3DCenter, 3DCenter-Forum (folgend), PDFs (#1, #2)

Bildergalerie

107
    • Kommentare (107)

      Zur Diskussion im Forum
      • Von Brehministrator BIOS-Overclocker(in)
        Zitat von cPT_cAPSLOCK
        Für viele Anwendungen sind single precision eigentlich vollkommen ausreichend, viele Numerikprogramme arbeiten aber trotzdem mit double precision, weil man es halt kann und weil man damit im Zweifel nichts falsch macht. Die Richtigkeit der Ergebnisse ist halt doch meistens eine Ecke wichtiger, als die benötigte Rechenzeit. Für absurd große Zahlen ist double precision besser geeignet, da Gleitkommazahlen halt exponentiell skaliert sind. Somit ist das obere Ende von DP deutlich höher als das von SP und die Lücken zwischen den darstellbaren Zahlen werden gegen Ende des darstellbaren Bereichs halt immer größer... aber das dürfte wirklich nur für Sonderbereiche interessant sein, für Spiele so oder so nicht, aber das wurde ja alles schon gesagt.
        gRU?; cAPS
        Es kommt natürlich stark auf die Anwendung an, da stimme ich voll zu. In meiner Sparte (Quantenchemie) kann man mit Single Precision leider überhaupt nix anfangen. Da geht es nicht mal um absolute Werte... Aber die Rundungsfehler von Single Precision erzeugen auf den Ergebnissen so ein starkes Rauschen, dass sie überhaupt nicht mehr verwendet werden können... Leider gibt es also auch Problemstellungen, wo an Double Precision einfach kein Weg vorbei führt

        Wie schon mehrfach geschrieben wurde: Für Spiele ist DP generell uninteressant. Da fiele mir nicht eine einzige Sache ein, die man nicht irgendwie (mit Tricks) auch mit SP hinkriegen würde SP hat ja immerhin ca. 8 signifikante Stellen, das ist schon ganz ordentlich.
      • Von Brehministrator BIOS-Overclocker(in)
        Zitat von cPT_cAPSLOCK
        Für viele Anwendungen sind single precision eigentlich vollkommen ausreichend, viele Numerikprogramme arbeiten aber trotzdem mit double precision, weil man es halt kann und weil man damit im Zweifel nichts falsch macht. Die Richtigkeit der Ergebnisse ist halt doch meistens eine Ecke wichtiger, als die benötigte Rechenzeit. Für absurd große Zahlen ist double precision besser geeignet, da Gleitkommazahlen halt exponentiell skaliert sind. Somit ist das obere Ende von DP deutlich höher als das von SP und die Lücken zwischen den darstellbaren Zahlen werden gegen Ende des darstellbaren Bereichs halt immer größer... aber das dürfte wirklich nur für Sonderbereiche interessant sein, für Spiele so oder so nicht, aber das wurde ja alles schon gesagt.
        gRU?; cAPS
        Es kommt natürlich stark auf die Anwendung an, da stimme ich voll zu. In meiner Sparte (Quantenchemie) kann man mit Single Precision leider überhaupt nix anfangen. Da geht es nicht mal um absolute Werte... Aber die Rundungsfehler von Single Precision erzeugen auf den Ergebnissen so ein starkes Rauschen, dass sie überhaupt nicht mehr verwendet werden können... Leider gibt es also auch Problemstellungen, wo an Double Precision einfach kein Weg vorbei führt

        Wie schon mehrfach geschrieben wurde: Für Spiele ist DP generell uninteressant. Da fiele mir nicht eine einzige Sache ein, die man nicht irgendwie (mit Tricks) auch mit SP hinkriegen würde SP hat ja immerhin ca. 8 signifikante Stellen, das ist schon ganz ordentlich.
      • Von K12_Beste
        Zitat von Atent123
        Gibt es eigentlich Infos ob bei dem Erdbeben
        Login to DIGITIMES archive & research

        Zitat
        Fertigungsanlagen für den High Performance Finfet Prozess beschädigt bzw zerstört wurden ?
        Taiwan Semiconductor Manufacturing Company Limited
      • Von cPT_cAPSLOCK BIOS-Overclocker(in)
        Zitat von Georgler
        Ah, ok, also eher mathematische Anwendungsbereiche. Vielen Dank für die Infos und den Link
        Für viele Anwendungen sind single precision eigentlich vollkommen ausreichend, viele Numerikprogramme arbeiten aber trotzdem mit double precision, weil man es halt kann und weil man damit im Zweifel nichts falsch macht. Die Richtigkeit der Ergebnisse ist halt doch meistens eine Ecke wichtiger, als die benötigte Rechenzeit. Für absurd große Zahlen ist double precision besser geeignet, da Gleitkommazahlen halt exponentiell skaliert sind. Somit ist das obere Ende von DP deutlich höher als das von SP und die Lücken zwischen den darstellbaren Zahlen werden gegen Ende des darstellbaren Bereichs halt immer größer... aber das dürfte wirklich nur für Sonderbereiche interessant sein, für Spiele so oder so nicht, aber das wurde ja alles schon gesagt.
        gRU?; cAPS
      • Von bans3i Komplett-PC-Aufrüster(in)
        Zitat von Georgler
        Ah, ok, also eher mathematische Anwendungsbereiche. Vielen Dank für die Infos und den Link
        Wenn du zb. eine Simulation laufen lässt, kann es mit 32bit Gleitkommazahlen recht schnell zu Rundungsfehlern kommen, die sich dann aufschaukeln und das Endergebnis total verfälschen.
      • Von Georgler PC-Selbstbauer(in)
        Ah, ok, also eher mathematische Anwendungsbereiche. Vielen Dank für die Infos und den Link
      Direkt zum Diskussionsende
  • Print / Abo
    Apps
    PCGH Magazin 08/2026 PC Games 07/2026 play5 08/2026 N-Zone 07/2026 Linux Magazin 07/2026 LinuxUser 07/2026 Raspberry Pi Geek 07/2026
    PC Games Hardware PC Games Linux Magazin Raspberry Pi Geek Computec Kiosk