Nvidia Quadro: Topmodell mit GP100 und 16 GiB HBM2
Nvidia hat im Rahmen der diesjährigen Solidworks Work sechs neue Grafikkarten für die Quadro-Workstation-Serie vorgestellt. Das neue Topmodell stellt die Quadro GP100 dar, die nach der eingesetzten GP100-GPU mit dazugehörigem HBM2 benannt ist. Die kleineren Neulinge basieren auf den Grafikchips GP104, GP106 und GP107.
Bisher hat Nvidia seine größte Pascal-GPU, den GP100 mit 610 mm², nur auf Tesla-Beschleunigerkarten angeboten. Die T esla P100 gibt es wahlweise als NV-Link-Modul oder als PCI-Express-Steckkarte mit gedrosselten Taktraten. Nun haben die Kalifornier die erste Quadro-Grafikkarte mit GP100 vorgestellt, die schlicht nach der GPU benannt wird: Quadro GP100. Erneut werden vier der 60 Shader-Multiprozessoren deaktiviert, sodass 3.584 Shader aktiv bleiben. Daraus ergeben sich 224 Textureinheiten, das Back-End bleibt mit 96 ROPs unverändert.
Die Rechenleistung beziffert Nvidia auf 10,3 FP32-TFLOPS (einfache Genauigkeit), die mit einem GPU-Takt von etwa 1.440 MHz erreicht würden. Der GP100 beherrscht FP16 (halbe Genauigkeit) mit der doppelten Rate, also 20,6 TFLOPS, und FP64 (doppelte Genauigkeit) mit der halben, also 5,15 TFLOPS. An dem 4.096 Bit breiten Speicher-Interface hängen vier 4-Hi-HBM2-Stacks mit jeweils 4 GiByte Kapazität (16 GiB gesamt). Den Speichertakt belässt Nvidia bei gut 1.400 MHz, sodass die Quadro GP100 auf eine Übertragungsrate von 720 GB/s kommt. Die Grafikkarte hat eine TDP von 235 Watt. Zum Vergleich: Die Tesla P100 ist 40 MHz schneller, darf aber 65 Watt mehr aufnehmen. Zwei Quadro GP100 können über eine doppelte NV-Link-Brücke zusammengeschlossen werden.
Unter der Quadro GP100 positioniert sich die bereits veröffentlichte P6000 mit GP102-Vollausbau. Die 3.840 Shader sind mit 1.531 MHz in FP32 schneller (11,8 TFLOPS), können aber weder FP64 noch FP16 schnell beschleunigen. Zum Einsatz kommen dort 24 GiByte GDDR5X-Speicher mit 432 GB/s. Ebenfalls schon verfügbar ist die P5000 mit GP104-Vollausbau und 16 GiByte GDDR5X. Darunter lösen neue Pascal-Modelle die Vorgänger mit Maxwell- und Kepler-GPUs ab.
Die Quadro P4000 nutzt einen GP104, der mit 14 aktiven SMs (1.792 Shader) stärker beschnitten wird als bei der Geforce GTX 1070. 5,3 FP32-TFLOPS würden über etwa 1.480 MHz GPU-Takt erreicht. 16 GiByte GDDR5 hängen an 256 Bit und kommen bei 243 GB/s auf etwa 3.800 MHz. Die TDP beläuft sich auf 105 Watt. Die P2000 nutzt einen GP106-Chip, der mit 1.024 aktiven Shadern stärker beschnitten wird als bei der GTX 1060 3GB. Unüblich ist das 160 Bit breite Speicher-Interface mit 5 GiByte GDDR5-Speicher (140 GB/s). 3,0 FP32-TFLOPs sollen bei einer TDP von 75 Watt erreicht werden. Die P1000, P600 und P400 setzen den GP107 mit 640, 384 beziehungsweise 256 Shadern ein, sollen 1,8, 1,1 respektive 0,6 FP32-TFLOPS erreichen und eine TDP von 30 bis 47 Watt aufweisen. 2 bis 4 GiByte GDDR5 hängen an 64 beziehungsweise 128 Bit.
| Modell | Quadra GP100 | Quadro P6000 | Quadro P5000 | Tesla P100 (NV-L) | Titan X |
|---|---|---|---|---|---|
| GPU | GP100 | GP102 | GP104 | GP100 | GP102 |
| Chipgröße (reiner Die) | 610 mm² | 471 mm² | 314 mm² | 610 mm² | 471 mm² |
| Transistoren Grafikchip (Mio.) | 15.300 | 12.000 | 7.200 | 15.300 | ~12.000 |
| Shader-/SIMD-/Textureinheiten | 3.584/56/224 | 3.840/30/240 | 2.560/20/160 | 3.584/56/224 | 3.584/28/224 |
| Raster-Endstufen (ROPs) | 96 | 96 | 64 | unbekannt | vmtl. 96 |
| GPU-Basistakt (Megahertz) | unbekannt | 1.417 | 1.607 | 1.328 | 1.417 |
| GPU-Boost-Takt (Megahertz) | ~1.440 | 1.531 | 1.733 | 1.480 | 1.531 |
| Rechenleistung HP/SP/DP (Mrd./s) | 20.600/10.300/5.150 | 11.757/11.757/368 | 8.873/8.873/277 | 21.216/10.608/5.304 | 10.974/10.974/343 |
| Speicheranbindung (Bit) | 4.096 | 384 | 256 | 4.096 | 384 |
| Speichertakt (MHz) | 1.406 | 4.504 | 4.504 | 1.406 | 5.004 |
| Speicherübertragung (GB/s) | 720 | 432 | 288 | 720 | 480 |
| Übliche Speichermenge (MiB) | 16.384 | 24.576 | 16.384 | 16.384 | 12.288 |
| PCI-Express-Stromanschlüsse | je 1 x 6-/8-polig | je 1 x 6-/8-polig | 1 x 8-polig | - | je 1 x 6-/8-polig |
| Typische Leistungsaufnahme | <235 Watt | <250 Watt | <180 Watt | <300 Watt | <250 Watt |


Jetzt kommt die Nachricht, das NVidia, die überhaupt nicht an der Entwicklung von HBM-/HBM2- und dem -Interposer beteiligt waren, plötzlich Karten mit HBM2 in Aussicht stellt. Also muss ja HBM2 da sein.
____
Für mich mal wieder erschreckend wie der größere an etwas rankommt, was der kleinere mit entwickelt hat und dadurch die Karten vom kleineren von vorn herein <evtl.> schlechter verfügbar sein könnten: Hersteller.
.
______
Wünsche mir einfach, das Vega richtig gut landet, mit HBM2 und so viel Power zu guten Preisen, dass die derzeitige Preisspirale mal aufgebrochen wird.
Für GDDR5X scheint AMD keinen dringenden Bedarf gehabt zu haben, Nvidia setzt ihn ja selber nur bei zwei SKUs (1080 / Titan X Pascal) ein.
Außerdem stellt sich mir die Frage, warum AMD nicht auf GDDR5X setzt, was NVidia tut, NVidia aber sehr wohl auf HBM2.
Ach, ich lass mich einfach überraschen; ist ja wahrscheinlich eh eine Kostenfrage.