Tesla P40 und P4: GP102-Vollausbau und GP104 mit nur 75 Watt Maximalverbrauch
Nvidia hat zwei neue Tesla-Beschleunigerkarten veröffentlicht, die auf der GP102- beziehungsweise GP104-GPU basieren. Beide Modelle sind so nicht als Geforce zu finden: Die P40 basiert auf dem GP102-Vollausbau mit 3.840 aktiven Shadern, wohingegen der vollwertige GP104 auf der P4 nur mit knapp 1,1 GHz rechnet, um so nur maximal 75 Watt zu verbrauchen.
Nachdem Nvidia vor knapp einem halben Jahr die Tesla P100 als erste Pascal-basierte Beschleunigerkarte vorgestellt hat, folgen nun die beiden kleinen Ableger P40 und P4 als Ablösung für die Maxwell-basierten M40 und M4. Anandtech.com nennt die konkreten Spezifikationen, die Nvidia offiziell noch zurückhält. Während GP100-basierte Rechencluster zum Anlernen von Deep-Learning-Systemen gedacht sind, sieht Nvidia die P40 und P4 für das Ausführen entsprechender Anwendungen - klar, zum Anlernen werden FP16-Operationen genutzt, die in der Pascal-Generation ausschließlich die GP100-GPU mit doppelter Rate beherrscht. Bei den zwei Neulingen wird dementsprechend die INT8-Leistung in den Vordergrund gestellt.
Wie schon die Quadro P6000 basiert die Tesla P40 auf dem GP102 im Vollausbau, kann also auf die vollen 3.840 Shader-Einheiten zurückgreifen. Fast 12 TFLOPS Single-Precision-Rechenleistung erreicht die P40 bei einem nominellen Boost-Takt von 1.531 MHz. Interessanterweise hat sich Nvidia hier gegen den Einsatz von GDDR5X-Speicher entschieden und setzt stattdessen auf 24 GiByte GDDR5, die mit 3.600 MHz laufen und so eine Übertragungsrate von 346 GB/s erreichen. Der Quadro P6000 stehen 480 GB/s zur Verfügung. Die maximale Leistungsaufnahme hat Nvidia wie typisch auf 250 Watt festgesetzt.
Die Tesla P4 kommt erneut im Low-Profile-Format daher und muss auf zusätzliche Stromstecker verzichten. Hatte Nvidia bei der M4 noch auf die kleinere GM206-GPU gesetzt, ist es bei der P4 der größere GP104. Damit diese auf 75 Watt getrimmt werden kann, muss der nominelle Boost auf 1.063 MHz herabgesenkt werden - quasi AMDs Nano-Prinzip. Alternativ kann man die Tesla P4 im 50-Watt-Modus laufen lassen. 8 GiByte GDDR5-Speicher arbeiten mit 3.000 MHz und erreichen bei 256 Bit eine Übertragungsrate von 192 GB/s.
| Tesla P100 | Tesla P40 | Tesla P4 | |
|---|---|---|---|
| GPU | GP100 | GP102 | GP104 |
| Chipgröße (reiner Die) | 610 mm² | 471 mm² | 314 mm² |
| Transistoren Grafikchip (Mio.) | 15.300 | 12.000 | 7.200 |
| Shader-/SIMD-/Textureinheiten | 3.584/56/224 | 3.840/30/240 | 2.560/20/160 |
| Raster-Endstufen (ROPs) | 96 | 96 | 64 |
| Basistakt (MHz) | 1.328 | 1.303 | 810 |
| Boost-Takt (MHz) | 1.480 | 1.531 | 1.063 |
| Rechenleistung INT8/SP/DP (Mio./s) | 42.434/10.608/5.304 | 47.031/11.758/367 | 21.770/5.443/170 |
| Speicheranbindung (Bit) | 4.096 | 384 | 256 |
| Geschw. Grafikspeicher (GT/s) | 0,7 | 7,2 | 6,0 |
| Übliche Speichermenge (GiB) | 16 | 24 | 8 |
| Speicherübertragung (GB/s) | 720 | 346 | 192 |
| TDP (Watt) | 300 | 250 | 50/75 |
| PCI-Express-Stromanschlüsse | - | je 1 × 6-/8-polig | - |

Die RX460 steht da zwar dank des Powergatings bei Teillast etwas besser da, dafür ist die Leistung eher meh...
Was NVidia mit der Pascal-Architektur leistet überrascht mich noch immer, selbst offensichtlich weit über den Sweetspot übertaktet bietet man die bessere Effizienz wie AMD und kann die Chips der Mittelklasse auf HighEnd-Karten verbauen.
Aus irgendwelchen Gründen hat TomsHardware aber das nicht bei allen Karten gemacht---würde mich mal echt interessieren, wie sich GP102, GP104 und GP106 jeweils bei festen Wattzahlen schlagen würden.
Aus irgendwelchen Gründen hat TomsHardware aber das nicht bei allen Karten gemacht---würde mich mal echt interessieren, wie sich GP102, GP104 und GP106 jeweils bei festen Wattzahlen schlagen würden.
dann im Afterburner auf 0,8V@1700MHz stellen und schon verbraucht sie ca. 75W