[Update mit Details] Nvidia Tesla K80: Server-Grafikkarte mit Dual-GK210 und 24 GiByte VRAM
Nvidia hat die Tesla K80 getaufte Server-Grafikkarte offiziell vorgestellt. Zum ersten Mal soll unbestätigten Meldungen zufolge der GK210 eingesetzt werden, sogar gleich doppelt, allerdings nur mit 13 SMX je GPU. Die Double-Precision-Leistung liegt bei 2,91 TFLOPS, die SP-Performance bei 8,74. Zudem bietet man mit 24 GiByte den bislang größten Videospeicher.
Auf dieser Seite
Quelle: Nvidia
Nvidia Tesla K80: Server-Grafikkarte mit Dual-GK210 und 24 GiByte VRAM (4)
Update vom 18.11.14:
Inzwischen hat Nvidia ein Datenblatt zur Tesla K80 veröffentlicht, das uns in einigen Aspekten Gewissheit verschafft: Zu allererst ist dort ganz offiziell die Rede vom GK210, der tatsächlich mit größeren Zwischenspeichern ausgestattet worden ist: Sowohl der gemeinsame L1-Cache als auch der Registerspeicher wurden mit 128 beziehungsweise 512 Kilobyte verdoppelt, womit die SMX besser "gefüttert" werden sollten. Darüber hinaus werden dort offensichtlich die Performance-Werte für die Mindesttaktraten angegeben: 5,6 respektive 1,87 TFLOPS (einfache/doppelte Genauigkeit) sollen es sein, womit sich ein Basis-Takt von rund 560 MHz ableiten lässt – und somit die geringe TDP von 300 Watt erklärt. Die Tabelle haben wir entsprechend angepasst. Zu guter Letzt beherrscht die Tesla K80 "Zero-Power Idle", womit einzelne GPUs bei fehlender Auslastung abgeschaltet werden (offenbar ähnlich wie bei AMDs "Zerocore"-Technologie).
Originalartikel vom 17.11.14:
Nachdem schon vor zwei Jahren die ersten Gerüchte über GK2xx-Grafikchips auftauchten, diese bislang aber nur bei Low-End-Grafikkarten der GTX-700-Reihe eingesetzt werden, hat Nvidia nunmehr die erste Grafikkarte auf Basis des High-End-Chips GK210 – oder besser gesagt dessen zwei – angekündigt. Die Rede ist von der Tesla K80, welche vor allem in Supercomputern ihren Einsatz finden soll. Laut eigenen Angaben soll die K80 doppelt so schnell sein wie die K40, im Detail machen sich allerdings einige Unterschiede bemerkbar.
So besitzt die K80 insgesamt 4.992 Shader- und 406 Textureinheiten, was für 13 SMX je GK210-GPU spricht. Ob es sich dabei um den Vollausbau handelt, können wir aktuell noch nicht sagen. Der GK110 jedenfalls besitzt bis zu 15 SMX mit 2.880 Shadereinheiten. Frühere Spekulationen sprachen von einer Vergrößerung des Caches beim GK210, der bei professionellen Anwendungen bisher limitiert haben soll. Womöglich hat Nvidia also zwei SMX zugunsten eines größeren Zwischenspeichers geopfert. Darüber hinaus sprechen die Kalifornier von einer Double-Precision-Leistung in Höhe von 2,91 TFLOPS, die SP-Performance wird auf 8,74 TFLOPS beziffert, womit man beim typischen 1:3-Verhältnis liegt. An den beiden 384-Bit-Speicherinterfaces hängen derweil insgesamt 24 GiByte GDDR5-Speicher, womit man alle bisherigen Grafikkarten (auch von AMD) überholt.
Die geringere Shaderanzahl wird derweil über einen höheren GPU-Takt ausgeglichen, der (ebenfalls rein rechnerisch) bei 870 MHz liegen müsste. Ein Boost-Modus ist vorhanden, wird allerdings nicht näher beziffert. Ausgehend vom Basis-Takt der K40 (1,43 DP-TFLOPS bei 745 MHz) kann die K80 ihre kleinere Schwester also pro GPU minimal überholen und so eine Verdoppelung der Geschwindigkeit auf dem Papier herausholen. Update: Wie uns Nvidia mitteilte, kommt die Tesla K80 mit einer TDP von lediglich 300 Watt, was in Anbetracht bisheriger GK110-Lösungen erstaunlich gering anmutet.
Interessant ist derweil die durchaus späte Vorstellung der Tesla K80, da im Desktop-Bereich bereits die Maxwell-Generation mit der Geforce GTX 980 sowie GTX 970 auf Basis des GM204 eingeläutet worden ist. Ob dies an einer etwaigen Verspätung (sofern man von einer solchen in Anbetracht einer fehlenden Ankündigung sprechen kann) von "Big-Maxwell" in Form des GM200 liegt, ist aktuell reine Spekulation.
| Modell | Tesla K80 | Tesla K40 | Tesla K20X | Tesla K20 | Firepro S10000 | Firepro S9150 |
|---|---|---|---|---|---|---|
| GPU | 2 × GK210 | GK110B | GK110 | GK110 | 2 × Tahiti XT | Hawaii XT |
| Shader-/SIMD-/Textureinheiten | 2 × 2.496/2 × 13/2 × 208 | 2.880/15/240 | 2.688/14/224 | 2.496/13/208 | 2 × 2.048/2 × 32/2 × 128 | 2.816/44/176 |
| GPU-Basistakt (Megahertz) | 560 (inoffiziell) | 745 | 732 | 705 | 2x 825 MHz | - |
| GPU-Boost-Takt (Megahertz) | 875 (inoffiziell) | 810/875 | - | - | - | ca. 900 (inoffiziell) |
| Rasterendstufen (ROPs) | 2 × 48 | 48 | 48 | 48 | 2 × 32 | 64 |
| Double-Precision-Leistung (TFLOPS) | 2,91 | 1,43 | 1,31 | 1,17 | 1,48 | 2,54 |
| Single-Precision-Leistung (TFLOPS) | 8,74 | 4,29 | 3,95 | 3,52 | 5,91 | 5,07 |
| Speichertakt | 2.500 | 3.000 | 2.600 | 2.600 | 2.500 | 2.500 (inoffiziell) |
| Speicheranbindung (parallele Bits) | 2 × 384 | 384 | 384 | 384 | 2 × 384 | 512 |
| Speicherübertragungsrate (GiByte/s) | 2 × 240 | 288 | 250 | 208 | 2 × 240 | 320 |
| Speichermenge (MiB) | 24.576 | 12.288 | 6.144 | 5.120 | 12.288 | 16.384 |
| TDP (Watt) | 300 | bis zu 235 | 235 | 225 | 375 | 235 |

An sich sollte das aber nicht DAS Problem sein, so lange man nicht PCI-E Switches oder Router drin hat. Es muss "nur" das Bios mitspielen, das könnte aber durchaus ein Problem sein, obwohl es die HArdware an sich könnte