Saturn V: Mit 5.280 Tesla V100 hat Nvidia den vierteffizientesten Supercomputer
Nvidia aktualisiert seinen hauseigenen Supercomputer Saturn V. In seiner neuen Ausführung stecken in dem Server 5.280 Beschleunigerkarten des Typs Tesla V100. Das ergibt schlanke 27.033.600 FP32-, 13.516.800 FP64- beziehungsweise 3.379.200 Tensor-Recheneinheiten, die auf eine Effizienz von 15 GFLOPS pro Watt kommen sollen.
Nvidia hat einen hauseigenen Supercomputer, mit dem unter anderem für den Autobereich neuronale Netzwerke trainiert werden. Das System hört auf den Namen Saturn V und lief bislang auf Basis von DGX-1-Konfigurationen, die wiederum aus jeweils zwei Broadwell-E-CPUs des Typs Xeon E5-2698 v4 (20 Kerne, 2,2 - 3,6 GHz) und acht Tesla P100 bestehen. Auf der SC17 hat Nvidia angekündigt, den Saturn V auf den Nachfolger Tesla V100 mit GV100- statt GP100-GPU aktualisieren zu wollen.
Insgesamt 660 Nodes vereinen 1.320 Xeon E5-2698 v4 mit dann 5.280 Tesla-V100-Beschleunigerkarten. Das ergibt 27.033.600 FP32-, 13.516.800 FP64- beziehungsweise 3.379.200 Tensor-Recheneinheiten. alternativ ausgedrückt: Rechnet man die CPUs und GPUs ohne jeglichen Speicher zusammen, ergibt das eine Siliziumfläche von fast fünf Quadratmetern. Nvidia verspricht eine maximale Rechenleistung von 660 PetaFLOPS (660.000 TFLOPS), die allerdings für Deep-Learning-Aufgaben mit den Tensor-Kernen gelten. In einfacher FP32-Genauigkeit sind 80 PFLOPS drin, in doppelter FP64-Genauigkeit 40 PFLOS. In Sachen Effizienz möchte der Chiphersteller in der Green-500-Liste unter den besten fünf mitspielen.
Ein Testlauf mit 112 Xeon-CPUs und 1.320 Tesla V100 überschritt die anvisierten 15 FP64-GFLOPS/Watt bereits, lief allerdings auch nur mit einem Leistungsbudget von 97 Kilowatt für die Beschleunigerkarten - das ergibt pro GPU gerade einmal knapp 75 Watt. Die absolute Leistung liegt dementsprechend "nur" auf dem Platz 149 der Top-500-Liste. Eine optimierte, nicht weiter spezifizierte Variante sieht für jede GPU sogar nur knapp 50 Watt vor. Die volle Leistung wird bei einer TDP von 300 Watt erreicht. Der Anführer der Green-500-Liste kommt derweil auf 17 FP64-GFLOPS/Watt.

hier z.B. wie auf der GTC Europe Keynote vorgestellt:
Ersparnis: => 1/6 der Kosten, 1/20 des Strombedarfs, 4 ganze Server Racks mit 160 CPU's @ 65 KWatt => in 1 HGX Server Box mit 8 Tesla V100 GPU's @ 3 KWatt
GTC17: NVIDIA prasentiert die nachste GPU-Architektur Volta - Tesla V100 mit 5.120 Shadereinheiten und 16 GB HBM2 - Hardwareluxx
Ich passe mal den Text an.
Aber das ist ja hier nicht das Thema.^^