Tesla P100: Pascal-GP100 kommt mit verringerten Taktraten als PCI-E-Steckkarte

18
News Mark Mantel Als bevorzugte Quelle auf Google hinzufügen
Tesla P100: GP100 kommt mit verringerten Taktraten als PCIe-Steckkarte (3)
Quelle: Tesla

Nvidia hat drei Beschleunigerkarten auf Basis der GP100-Pascal-GPU offiziell angekündigt. Die Tesla P100 wird es neben einem proprietären NV-Link-Modul auch in zwei Ausführungen als PCI-Express-Steckkarte geben. Mit einer Drosselung von 300 auf 250 Watt gehen niedrigere Taktraten einher. Die Auslieferung soll im vierten Quartal 2016 beginnen.

Nvidia hatte die Tesla P100 in Form eines NV-Link-Moduls bereits Anfang April auf der Hausmesse GTC vorgestellt und eine Auslieferung für bestimmte Supercomputer ab dem Sommer versprochen. In einer Pressemitteilung folgte jüngst die Ankündigung für das "gemeine Volk", welche das Pascal-Topmodell für ihre Rechenserver nutzen wollen. Insgesamt wird es drei verschiedene Ausführungen der Tesla P100 geben. Alle drei basieren auf dem 610 mm² großen GP100, von dessen 3.840 Shader-Einheiten 3.584 aktiviert sind.

Die erste kennt man bereits von der GTC und stellt ein Modul dar, das über NV-Links angebunden wird. Mit einem Boost-Takt von 1.480 MHz wird eine Rechenleistung von 21,2/10,6/5,3 TFLOPS (Half-/-Single-/Double-Precision) im 4:2:1-Verhältnis erreicht. Da nur IBM die NV-Links in seinen CPUs integriert hat, ist das Modul ausschließlich mit den Power8+- und Power9-Prozessoren kompatibel. Die TDP beläuft sich auf 300 Watt. Darüber hinaus wird es zwei PCI-Express-Steckkarten geben, welche sich die im HPC-Bereich üblichen 250 Watt genehmigen dürfen. Nvidia beziffert die Rechenleistung auf 18,7/9,3/4,7 TFLOPS, was auf einen typischen GPU-Boost-Takt von rund 1.300 MHz schließen lässt. Beim ersten PCIe-Modell stehen wie auch beim NV-Link-Modul 16 GiByte High Bandwidth Memory 2 zur Verfügung, was bei 4.096 Bit und 700 MHz eine Übertragungsrate von 720 GB/s ergibt. Bei einer zweiten PCIe-Ausführung wurde einer der vier 1.024-Bit-Speichercontroller deaktiviert, sodass nur noch 12 GiByte bei 540 GB/s zur Verfügung stehen. Das kann der Fall sein, wenn der Speichercontroller selbst einen Belichtungsfehler hat oder beim Stacking von Interposer, GP100-GPU und HBM2 etwas schief gegangen ist.

Nvidia geht davon aus, dass die Tesla P100 ab dem vierten Quartal 2016 über die bekannten Zwischenhändler und Server-OEMs ausgeliefert wird. Da Tesla-GPUs als reine Beschleunigerkarten dienen und dementsprechend keine Bildausgänge besitzen, ist ein Desktop-Einsatz nicht möglich.

  Tesla P100 Tesla P100 Tesla P100 Tesla M40
GPU GP100 (Pascal) GP100 (Pascal) GP100 (Pascal) GM200 (Maxwell)
Bauart NV-Link-Modul PCI-Express PCI-Express PCI-Express
Transistoren 15,3 Mrd. 15,3 Mrd. 15,3 Mrd. 8 Mrd.
GPU-Die-Größe 610 mm² 610 mm² 610 mm² 601 mm²
Fertigungsstruktur 16 nm 16 nm 16 nm 28 nm
SMs 56 56 56 24
TPCs 28 28 28 24
FP32-Shader/SM 64 64 64 128
FP32-Shader/GPU 3.584 3.584 3.584 3.072
FP64-Shader/SM 32 32 32 4
FP64-Shader/GPU 1.792 1.792 1.792 96
Basistakt 1.328 MHz unbekannt unbekannt 948 MHz
Boost-Takt 1.480 MHz ca. 1.300 MHz ca. 1.300 MHz 1.114 MHz
TFLOPS (FP16/FP32/FP64) 21,2/10,6/5,3 18,7/9,3/4,7 18,7/9,3/4,7 5,83/0,21/-
Textureinheiten 224 224 224 192
Speicherinterface 4.096 Bit HBM2 4.096 Bit HBM2 3.072 Bit HBM2 384 Bit GDDR5
Speichergröße 16 GiByte 16 GiByte 12 GiByte Max. 24 GiByte
TDP 300 Watt 250 Watt 250 Watt 250 Watt

Bildergalerie

18
    • Kommentare (18)

      Zur Diskussion im Forum
      • Von OOYL Freizeitschrauber(in)
        Das ist Highend.
      • Von OOYL Freizeitschrauber(in)
        Das ist Highend.
      • Von Mephisto_xD BIOS-Overclocker(in)
        Zitat von bschicht86
        Ähm. Nur mal zum Mitmeißeln. Wo wird denn Bandbreite gebraucht, außer der Power-Prozessor will direkt den VRAM der GPU als Arbeitsspeicher HSA-like oder umgekehrt mißbrauchen? Wenn das nicht der Fall ist, dann wird auch keine Bandbreite gebraucht.
        Ähhm, nein. In HPC-Anwendungen sind 16 GByte Speicher geradezu winzig, es hat schließlich Gründe warum Racks solcher Rechner mehr RAM haben als der gewöhnliche Enthusiast Festplattenspeicher.

        Schon simpelste numerische Probleme können hunderte Gigabyte RAM brauchen um überhaupt den Zustand unkomprimiert zu speichern. Und da wurde dann noch nix gerechnet. Damit die GPU was rechnet müssen Teile davon in den VRAM, und wie kommen die dahin? Richtig, über den schnarchlahmen PCIe, oder eben in Zukunft über den nicht ganz so schnarchlahmen NVLink. Da nicht die ganze Rechenaufgabe in den VRAM geladen werden kann muss aus dem Hauptspeicher geswappt werden, und hier limitiert dann PCIe oder NVLink plötzlich enorm.

        In Supercomputern ist es außerdem egal ob eine Schnittstelle proprietär ist oder nicht, denn sie wird meist direkt angesprochen, das reduziert die Latenz und den Durchsatz.
      • Von Bevier Volt-Modder(in)
        Zitat von LameStart
        Falsch. Absolut falsch.

        Ja, ergibt Sinn. Wenn man wüsste, wie der HPC-Bereich funktioniert. Da du dies nicht tust, erkennst du den natürlich auch nicht. Ich frage mich dann aber, warum man zu Themen in einem Forum kommentieren möchte, inklusive die Zurechtweisung anderer User, wenn man vom THema keine Ahnung hat?

        Gratulation. Direkt zwei Lügen in zwei Halbsätzen.
        Ich glaub sehr wohl, dass ich es viel besser verstehe als du. Daher weiß ich auch nicht, was du damit sagen willst ^^
        1. ist es sehr wohl großartig, dass nV es ermöglicht, mehr Karten zusammenzuschalten aber es ist halt relativ sinnlos, dass sie gleichzeitig verhindern wollen, mehr als 2 Karten für Spiele im SLI zusammenzuschließen. Und das Versuchen sie immerhin. Und da du so ein großer Wissender bist, kannst du mir das sicherlich sehr deutlich zu erkären... Und 2. wo habe ich gelogen? Dass es aboslut Offtopic ist oder, dass es sich bei dir nicht um einen Zweiaccount eines gewissen "nVidiaNutzers", der bereits wohlbekannt für seine Angriffe ist, handelt? Denn dann wärest du nur ein sehr trauriger, weiterer Fall. Aber da ich mit meiner Annahme wohl richtig liege und dank dir sicher eine weiter Verwarnung erhalten werde, werde ich dich in Zukunft einfach irgnorieren.
      • Von LameStart
        Zitat von Bevier
        Ok, ist ein Vorteil, wenn auch recht speziell und bisher kaum von irgendwelcher Software genutzt...
        Falsch. Absolut falsch.

        Zitat von Bevier
        Andererseits wollen sie zeitgleich die Nutzung von mehr als 2 Karten zumindest im Spielebereich grundsätzlich verhindern. Sinn? ^^
        Ja, ergibt Sinn. Wenn man wüsste, wie der HPC-Bereich funktioniert. Da du dies nicht tust, erkennst du den natürlich auch nicht. Ich frage mich dann aber, warum man zu Themen in einem Forum kommentieren möchte, inklusive die Zurechtweisung anderer User, wenn man vom THema keine Ahnung hat?

        Zitat von Bevier
        ist selbst absolut offtopic, wie man es von Wiederholungstätern erwartet.
        Gratulation. Direkt zwei Lügen in zwei Halbsätzen.
      • Von Bevier Volt-Modder(in)
        Zitat von Tech_13
        NVLink soll bis zu 8 Karten ansteuern können, bei PCIe sollen das bis jetzt nur 4 sein (in einem System).
        Ok, ist ein Vorteil, wenn auch recht speziell und bisher kaum von irgendwelcher Software genutzt...
        Andererseits wollen sie zeitgleich die Nutzung von mehr als 2 Karten zumindest im Spielebereich grundsätzlich verhindern. Sinn? ^^
      Direkt zum Diskussionsende
  • Print / Abo
    Apps
    PCGH Magazin 07/2026 PC Games 06/2026 play5 07/2026 N-Zone 06/2026 Linux Magazin 06/2026 LinuxUser 06/2026 Raspberry Pi Geek 07/2026
    PC Games Hardware PC Games Linux Magazin Raspberry Pi Geek Computec Kiosk