Tesla P40 und P4: GP102-Vollausbau und GP104 mit nur 75 Watt Maximalverbrauch

8
News Mark Mantel Als bevorzugte Quelle auf Google hinzufügen
Tesla P40 und P4: GP102-Vollausbau und GP104 mit 75 Watt Maximalverbrauch (4)
Quelle: Nvidia

Nvidia hat zwei neue Tesla-Beschleunigerkarten veröffentlicht, die auf der GP102- beziehungsweise GP104-GPU basieren. Beide Modelle sind so nicht als Geforce zu finden: Die P40 basiert auf dem GP102-Vollausbau mit 3.840 aktiven Shadern, wohingegen der vollwertige GP104 auf der P4 nur mit knapp 1,1 GHz rechnet, um so nur maximal 75 Watt zu verbrauchen.

Nachdem Nvidia vor knapp einem halben Jahr die Tesla P100 als erste Pascal-basierte Beschleunigerkarte vorgestellt hat, folgen nun die beiden kleinen Ableger P40 und P4 als Ablösung für die Maxwell-basierten M40 und M4. Anandtech.com nennt die konkreten Spezifikationen, die Nvidia offiziell noch zurückhält. Während GP100-basierte Rechencluster zum Anlernen von Deep-Learning-Systemen gedacht sind, sieht Nvidia die P40 und P4 für das Ausführen entsprechender Anwendungen - klar, zum Anlernen werden FP16-Operationen genutzt, die in der Pascal-Generation ausschließlich die GP100-GPU mit doppelter Rate beherrscht. Bei den zwei Neulingen wird dementsprechend die INT8-Leistung in den Vordergrund gestellt.

Übersicht Tesla P40 und Tesla P4 Tesla P40 und P4: GP102-Vollausbau und GP104 mit 75 Watt Maximalverbrauch (1) Quelle: Nvidia Tesla P40 und P4: GP102-Vollausbau und GP104 mit 75 Watt Maximalverbrauch (3) Quelle: Nvidia

Wie schon die Quadro P6000 basiert die Tesla P40 auf dem GP102 im Vollausbau, kann also auf die vollen 3.840 Shader-Einheiten zurückgreifen. Fast 12 TFLOPS Single-Precision-Rechenleistung erreicht die P40 bei einem nominellen Boost-Takt von 1.531 MHz. Interessanterweise hat sich Nvidia hier gegen den Einsatz von GDDR5X-Speicher entschieden und setzt stattdessen auf 24 GiByte GDDR5, die mit 3.600 MHz laufen und so eine Übertragungsrate von 346 GB/s erreichen. Der Quadro P6000 stehen 480 GB/s zur Verfügung. Die maximale Leistungsaufnahme hat Nvidia wie typisch auf 250 Watt festgesetzt.

Die Tesla P4 kommt erneut im Low-Profile-Format daher und muss auf zusätzliche Stromstecker verzichten. Hatte Nvidia bei der M4 noch auf die kleinere GM206-GPU gesetzt, ist es bei der P4 der größere GP104. Damit diese auf 75 Watt getrimmt werden kann, muss der nominelle Boost auf 1.063 MHz herabgesenkt werden - quasi AMDs Nano-Prinzip. Alternativ kann man die Tesla P4 im 50-Watt-Modus laufen lassen. 8 GiByte GDDR5-Speicher arbeiten mit 3.000 MHz und erreichen bei 256 Bit eine Übertragungsrate von 192 GB/s.

  Tesla P100 Tesla P40 Tesla P4
GPU GP100 GP102 GP104
Chipgröße (reiner Die) 610 mm² 471 mm² 314 mm²
Transistoren Grafikchip (Mio.) 15.300 12.000 7.200
Shader-/SIMD-/Textureinheiten 3.584/56/224 3.840/30/240 2.560/20/160
Raster-Endstufen (ROPs) 96 96 64
Basistakt (MHz) 1.328 1.303 810
Boost-Takt (MHz) 1.480 1.531 1.063
Rechenleistung INT8/SP/DP (Mio./s) 42.434/10.608/5.304 47.031/11.758/367 21.770/5.443/170
Speicheranbindung (Bit) 4.096 384 256
Geschw. Grafikspeicher (GT/s) 0,7 7,2 6,0
Übliche Speichermenge (GiB) 16 24 8
Speicherübertragung (GB/s) 720 346 192
TDP (Watt) 300 250 50/75
PCI-Express-Stromanschlüsse - je 1 × 6-/8-polig -
8
    • Kommentare (8)

      Zur Diskussion im Forum
      • Von iGameKudan Volt-Modder(in)
        Zitat von Rollora
        Umso schwerer sehe ich hier AMDs stand mit der bestehenden Architektur, zeigt das doch wie sehr sie im Limit arbeiten was die Effizienz betrifft.
        Ich halte persönlich die GCN-Architektur verantwortlich und bin der Meinung, dass der Effizienzvorteil von Polaris gegenüber Hawaii hauptsächlich durch die neue Fertigung entsteht... Solange sich AMD nicht von GCN trennt, wird das nix, denn selbst von DP-Leistung befreit scheint GCN eher so "Meh" zu sein. Ja, die RX480 ist so effizient wie ne 980 - letztere ist aber halt ne 28nm-Karte.

        Die RX460 steht da zwar dank des Powergatings bei Teillast etwas besser da, dafür ist die Leistung eher meh...

        Was NVidia mit der Pascal-Architektur leistet überrascht mich noch immer, selbst offensichtlich weit über den Sweetspot übertaktet bietet man die bessere Effizienz wie AMD und kann die Chips der Mittelklasse auf HighEnd-Karten verbauen.
      • Von iGameKudan Volt-Modder(in)
        Zitat von Rollora
        Umso schwerer sehe ich hier AMDs stand mit der bestehenden Architektur, zeigt das doch wie sehr sie im Limit arbeiten was die Effizienz betrifft.
        Ich halte persönlich die GCN-Architektur verantwortlich und bin der Meinung, dass der Effizienzvorteil von Polaris gegenüber Hawaii hauptsächlich durch die neue Fertigung entsteht... Solange sich AMD nicht von GCN trennt, wird das nix, denn selbst von DP-Leistung befreit scheint GCN eher so "Meh" zu sein. Ja, die RX480 ist so effizient wie ne 980 - letztere ist aber halt ne 28nm-Karte.

        Die RX460 steht da zwar dank des Powergatings bei Teillast etwas besser da, dafür ist die Leistung eher meh...

        Was NVidia mit der Pascal-Architektur leistet überrascht mich noch immer, selbst offensichtlich weit über den Sweetspot übertaktet bietet man die bessere Effizienz wie AMD und kann die Chips der Mittelklasse auf HighEnd-Karten verbauen.
      • Von Rollora Kokü-Junkie (m/w)
        Zitat von CD LABS: Radon Project
        Dann wirf mal einen Blick hierein: Effizienztest und Uber-/Untertaktung - Nvidia GeForce GTX 1060 FE 6GB: Pascal fur den Mainstream
        Aus irgendwelchen Gründen hat TomsHardware aber das nicht bei allen Karten gemacht---würde mich mal echt interessieren, wie sich GP102, GP104 und GP106 jeweils bei festen Wattzahlen schlagen würden.
        Geile Sache. Ich mein' echt: die Performance die man schon für 60 Watt haben kann mit Pascal ist unglaublich. Umso schwerer sehe ich hier AMDs stand mit der bestehenden Architektur, zeigt das doch wie sehr sie im Limit arbeiten was die Effizienz betrifft.
      • Von CD LABS: Radon Project Lötkolbengott/-göttin
        Zitat von Rollora
        Eine 1060@75Watt würde ich sofort kaufen, wenn sie nur 15-20% weniger Performance hat
        Dann wirf mal einen Blick hierein: Effizienztest und Uber-/Untertaktung - Nvidia GeForce GTX 1060 FE 6GB: Pascal fur den Mainstream
        Aus irgendwelchen Gründen hat TomsHardware aber das nicht bei allen Karten gemacht---würde mich mal echt interessieren, wie sich GP102, GP104 und GP106 jeweils bei festen Wattzahlen schlagen würden.
      • Von Gast1748380205
        P4 wäre als 1080Mini irgendwie geil
      • Von RawMangoJuli Lötkolbengott/-göttin
        Zitat von Rollora
        Eine 1060@75Watt würde ich sofort kaufen, wenn sie nur 15-20% weniger Performance hat
        dann kauf dir mal ganz schnell eine

        dann im Afterburner auf 0,8V@1700MHz stellen und schon verbraucht sie ca. 75W
      Direkt zum Diskussionsende
  • Print / Abo
    Apps
    PCGH Magazin 07/2026 PC Games 06/2026 play5 07/2026 N-Zone 06/2026 Linux Magazin 06/2026 LinuxUser 06/2026 Raspberry Pi Geek 07/2026
    PC Games Hardware PC Games Linux Magazin Raspberry Pi Geek Computec Kiosk