[Update mit Details] Nvidia Tesla K80: Server-Grafikkarte mit Dual-GK210 und 24 GiByte VRAM

News 18.11.2014 um 16:45 Uhr Mark Mantel Als bevorzugte Quelle auf Google hinzufügen

Quelle: Nvidia

Nvidia hat die Tesla K80 getaufte Server-Grafikkarte offiziell vorgestellt. Zum ersten Mal soll unbestätigten Meldungen zufolge der GK210 eingesetzt werden, sogar gleich doppelt, allerdings nur mit 13 SMX je GPU. Die Double-Precision-Leistung liegt bei 2,91 TFLOPS, die SP-Performance bei 8,74. Zudem bietet man mit 24 GiByte den bislang größten Videospeicher.

Quelle: Nvidia Nvidia Tesla K80: Server-Grafikkarte mit Dual-GK210 und 24 GiByte VRAM (4)

Update vom 18.11.14:

Inzwischen hat Nvidia ein Datenblatt zur Tesla K80 veröffentlicht, das uns in einigen Aspekten Gewissheit verschafft: Zu allererst ist dort ganz offiziell die Rede vom GK210, der tatsächlich mit größeren Zwischenspeichern ausgestattet worden ist: Sowohl der gemeinsame L1-Cache als auch der Registerspeicher wurden mit 128 beziehungsweise 512 Kilobyte verdoppelt, womit die SMX besser "gefüttert" werden sollten. Darüber hinaus werden dort offensichtlich die Performance-Werte für die Mindesttaktraten angegeben: 5,6 respektive 1,87 TFLOPS (einfache/doppelte Genauigkeit) sollen es sein, womit sich ein Basis-Takt von rund 560 MHz ableiten lässt – und somit die geringe TDP von 300 Watt erklärt. Die Tabelle haben wir entsprechend angepasst. Zu guter Letzt beherrscht die Tesla K80 "Zero-Power Idle", womit einzelne GPUs bei fehlender Auslastung abgeschaltet werden (offenbar ähnlich wie bei AMDs "Zerocore"-Technologie).

Originalartikel vom 17.11.14:

Nachdem schon vor zwei Jahren die ersten Gerüchte über GK2xx-Grafikchips auftauchten, diese bislang aber nur bei Low-End-Grafikkarten der GTX-700-Reihe eingesetzt werden, hat Nvidia nunmehr die erste Grafikkarte auf Basis des High-End-Chips GK210 – oder besser gesagt dessen zwei – angekündigt. Die Rede ist von der Tesla K80, welche vor allem in Supercomputern ihren Einsatz finden soll. Laut eigenen Angaben soll die K80 doppelt so schnell sein wie die K40, im Detail machen sich allerdings einige Unterschiede bemerkbar.

So besitzt die K80 insgesamt 4.992 Shader- und 406 Textureinheiten, was für 13 SMX je GK210-GPU spricht. Ob es sich dabei um den Vollausbau handelt, können wir aktuell noch nicht sagen. Der GK110 jedenfalls besitzt bis zu 15 SMX mit 2.880 Shadereinheiten. Frühere Spekulationen sprachen von einer Vergrößerung des Caches beim GK210, der bei professionellen Anwendungen bisher limitiert haben soll. Womöglich hat Nvidia also zwei SMX zugunsten eines größeren Zwischenspeichers geopfert. Darüber hinaus sprechen die Kalifornier von einer Double-Precision-Leistung in Höhe von 2,91 TFLOPS, die SP-Performance wird auf 8,74 TFLOPS beziffert, womit man beim typischen 1:3-Verhältnis liegt. An den beiden 384-Bit-Speicherinterfaces hängen derweil insgesamt 24 GiByte GDDR5-Speicher, womit man alle bisherigen Grafikkarten (auch von AMD) überholt.

Die geringere Shaderanzahl wird derweil über einen höheren GPU-Takt ausgeglichen, der (ebenfalls rein rechnerisch) bei 870 MHz liegen müsste. Ein Boost-Modus ist vorhanden, wird allerdings nicht näher beziffert. Ausgehend vom Basis-Takt der K40 (1,43 DP-TFLOPS bei 745 MHz) kann die K80 ihre kleinere Schwester also pro GPU minimal überholen und so eine Verdoppelung der Geschwindigkeit auf dem Papier herausholen. Update: Wie uns Nvidia mitteilte, kommt die Tesla K80 mit einer TDP von lediglich 300 Watt, was in Anbetracht bisheriger GK110-Lösungen erstaunlich gering anmutet.

Interessant ist derweil die durchaus späte Vorstellung der Tesla K80, da im Desktop-Bereich bereits die Maxwell-Generation mit der Geforce GTX 980 sowie GTX 970 auf Basis des GM204 eingeläutet worden ist. Ob dies an einer etwaigen Verspätung (sofern man von einer solchen in Anbetracht einer fehlenden Ankündigung sprechen kann) von "Big-Maxwell" in Form des GM200 liegt, ist aktuell reine Spekulation.

Modell	Tesla K80	Tesla K40	Tesla K20X	Tesla K20	Firepro S10000	Firepro S9150
GPU	2 × GK210	GK110B	GK110	GK110	2 × Tahiti XT	Hawaii XT
Shader-/SIMD-/Textureinheiten	2 × 2.496/2 × 13/2 × 208	2.880/15/240	2.688/14/224	2.496/13/208	2 × 2.048/2 × 32/2 × 128	2.816/44/176
GPU-Basistakt (Megahertz)	560 (inoffiziell)	745	732	705	2x 825 MHz	-
GPU-Boost-Takt (Megahertz)	875 (inoffiziell)	810/875	-	-	-	ca. 900 (inoffiziell)
Rasterendstufen (ROPs)	2 × 48	48	48	48	2 × 32	64
Double-Precision-Leistung (TFLOPS)	2,91	1,43	1,31	1,17	1,48	2,54
Single-Precision-Leistung (TFLOPS)	8,74	4,29	3,95	3,52	5,91	5,07
Speichertakt	2.500	3.000	2.600	2.600	2.500	2.500 (inoffiziell)
Speicheranbindung (parallele Bits)	2 × 384	384	384	384	2 × 384	512
Speicherübertragungsrate (GiByte/s)	2 × 240	288	250	208	2 × 240	320
Speichermenge (MiB)	24.576	12.288	6.144	5.120	12.288	16.384
TDP (Watt)	300	bis zu 235	235	225	375	235

Bildergalerie

Artikel teilen

Per E-Mail versenden