Tesla P100: Pascal-GP100 kommt mit verringerten Taktraten als PCI-E-Steckkarte
Nvidia hat drei Beschleunigerkarten auf Basis der GP100-Pascal-GPU offiziell angekündigt. Die Tesla P100 wird es neben einem proprietären NV-Link-Modul auch in zwei Ausführungen als PCI-Express-Steckkarte geben. Mit einer Drosselung von 300 auf 250 Watt gehen niedrigere Taktraten einher. Die Auslieferung soll im vierten Quartal 2016 beginnen.
Nvidia hatte die Tesla P100 in Form eines NV-Link-Moduls bereits Anfang April auf der Hausmesse GTC vorgestellt und eine Auslieferung für bestimmte Supercomputer ab dem Sommer versprochen. In einer Pressemitteilung folgte jüngst die Ankündigung für das "gemeine Volk", welche das Pascal-Topmodell für ihre Rechenserver nutzen wollen. Insgesamt wird es drei verschiedene Ausführungen der Tesla P100 geben. Alle drei basieren auf dem 610 mm² großen GP100, von dessen 3.840 Shader-Einheiten 3.584 aktiviert sind.
Die erste kennt man bereits von der GTC und stellt ein Modul dar, das über NV-Links angebunden wird. Mit einem Boost-Takt von 1.480 MHz wird eine Rechenleistung von 21,2/10,6/5,3 TFLOPS (Half-/-Single-/Double-Precision) im 4:2:1-Verhältnis erreicht. Da nur IBM die NV-Links in seinen CPUs integriert hat, ist das Modul ausschließlich mit den Power8+- und Power9-Prozessoren kompatibel. Die TDP beläuft sich auf 300 Watt. Darüber hinaus wird es zwei PCI-Express-Steckkarten geben, welche sich die im HPC-Bereich üblichen 250 Watt genehmigen dürfen. Nvidia beziffert die Rechenleistung auf 18,7/9,3/4,7 TFLOPS, was auf einen typischen GPU-Boost-Takt von rund 1.300 MHz schließen lässt. Beim ersten PCIe-Modell stehen wie auch beim NV-Link-Modul 16 GiByte High Bandwidth Memory 2 zur Verfügung, was bei 4.096 Bit und 700 MHz eine Übertragungsrate von 720 GB/s ergibt. Bei einer zweiten PCIe-Ausführung wurde einer der vier 1.024-Bit-Speichercontroller deaktiviert, sodass nur noch 12 GiByte bei 540 GB/s zur Verfügung stehen. Das kann der Fall sein, wenn der Speichercontroller selbst einen Belichtungsfehler hat oder beim Stacking von Interposer, GP100-GPU und HBM2 etwas schief gegangen ist.
Nvidia geht davon aus, dass die Tesla P100 ab dem vierten Quartal 2016 über die bekannten Zwischenhändler und Server-OEMs ausgeliefert wird. Da Tesla-GPUs als reine Beschleunigerkarten dienen und dementsprechend keine Bildausgänge besitzen, ist ein Desktop-Einsatz nicht möglich.
| Tesla P100 | Tesla P100 | Tesla P100 | Tesla M40 | |
|---|---|---|---|---|
| GPU | GP100 (Pascal) | GP100 (Pascal) | GP100 (Pascal) | GM200 (Maxwell) |
| Bauart | NV-Link-Modul | PCI-Express | PCI-Express | PCI-Express |
| Transistoren | 15,3 Mrd. | 15,3 Mrd. | 15,3 Mrd. | 8 Mrd. |
| GPU-Die-Größe | 610 mm² | 610 mm² | 610 mm² | 601 mm² |
| Fertigungsstruktur | 16 nm | 16 nm | 16 nm | 28 nm |
| SMs | 56 | 56 | 56 | 24 |
| TPCs | 28 | 28 | 28 | 24 |
| FP32-Shader/SM | 64 | 64 | 64 | 128 |
| FP32-Shader/GPU | 3.584 | 3.584 | 3.584 | 3.072 |
| FP64-Shader/SM | 32 | 32 | 32 | 4 |
| FP64-Shader/GPU | 1.792 | 1.792 | 1.792 | 96 |
| Basistakt | 1.328 MHz | unbekannt | unbekannt | 948 MHz |
| Boost-Takt | 1.480 MHz | ca. 1.300 MHz | ca. 1.300 MHz | 1.114 MHz |
| TFLOPS (FP16/FP32/FP64) | 21,2/10,6/5,3 | 18,7/9,3/4,7 | 18,7/9,3/4,7 | 5,83/0,21/- |
| Textureinheiten | 224 | 224 | 224 | 192 |
| Speicherinterface | 4.096 Bit HBM2 | 4.096 Bit HBM2 | 3.072 Bit HBM2 | 384 Bit GDDR5 |
| Speichergröße | 16 GiByte | 16 GiByte | 12 GiByte | Max. 24 GiByte |
| TDP | 300 Watt | 250 Watt | 250 Watt | 250 Watt |

Schon simpelste numerische Probleme können hunderte Gigabyte RAM brauchen um überhaupt den Zustand unkomprimiert zu speichern. Und da wurde dann noch nix gerechnet. Damit die GPU was rechnet müssen Teile davon in den VRAM, und wie kommen die dahin? Richtig, über den schnarchlahmen PCIe, oder eben in Zukunft über den nicht ganz so schnarchlahmen NVLink. Da nicht die ganze Rechenaufgabe in den VRAM geladen werden kann muss aus dem Hauptspeicher geswappt werden, und hier limitiert dann PCIe oder NVLink plötzlich enorm.
In Supercomputern ist es außerdem egal ob eine Schnittstelle proprietär ist oder nicht, denn sie wird meist direkt angesprochen, das reduziert die Latenz und den Durchsatz.
Ja, ergibt Sinn. Wenn man wüsste, wie der HPC-Bereich funktioniert. Da du dies nicht tust, erkennst du den natürlich auch nicht. Ich frage mich dann aber, warum man zu Themen in einem Forum kommentieren möchte, inklusive die Zurechtweisung anderer User, wenn man vom THema keine Ahnung hat?
Gratulation. Direkt zwei Lügen in zwei Halbsätzen.
1. ist es sehr wohl großartig, dass nV es ermöglicht, mehr Karten zusammenzuschalten aber es ist halt relativ sinnlos, dass sie gleichzeitig verhindern wollen, mehr als 2 Karten für Spiele im SLI zusammenzuschließen. Und das Versuchen sie immerhin. Und da du so ein großer Wissender bist, kannst du mir das sicherlich sehr deutlich zu erkären... Und 2. wo habe ich gelogen? Dass es aboslut Offtopic ist oder, dass es sich bei dir nicht um einen Zweiaccount eines gewissen "nVidiaNutzers", der bereits wohlbekannt für seine Angriffe ist, handelt? Denn dann wärest du nur ein sehr trauriger, weiterer Fall. Aber da ich mit meiner Annahme wohl richtig liege und dank dir sicher eine weiter Verwarnung erhalten werde, werde ich dich in Zukunft einfach irgnorieren.
Andererseits wollen sie zeitgleich die Nutzung von mehr als 2 Karten zumindest im Spielebereich grundsätzlich verhindern. Sinn? ^^