Nvidia Titan A im Test: Die erste Grafikkarte mit 100 Tera-FLOPS - und 666 Watt Boardpower [Update]
Update: April, April! Die Herrschaft der Geforce RTX 4090 währte nicht lange. Noch vor dem ersten "halben Geburtstag" entthront Nvidia sein Ada-Flaggschiff mit einem Trümmer der Superlative: der Titan A. Sie führt die zehnjährige Titan-Tradition mit beinahe unfüllbarem Speicher fort und ist damit ein Fest für betuchte Enthusiasten und Content Creator.
In diesem Artikel
Update vom 2. April: Findige Leser haben es längst bemerkt - die Nvidia Titan A ist unser Beitrag anlässlich des 1. Aprils. Wir haben uns sowohl den Namen als auch Design und Spezifikation ausgedacht und mit mehr oder minder subtilen Gags ausgeschmückt, um die Scherzhaftigkeit dieses "Tests" anzudeuten. Allerdings ist nicht alles in diesem Artikel erfunden! Einer (sporadisch ausgelebten) PCGH-Tradition folgend, sind die Benchmarks absolut authentisch - sie zeigen jedoch keine "Titan A", sondern eine Geforce RTX 4090, welche wir bestmöglich übertakten. Die Test-Grafikkarte läuft mit maximalem Powerlimit von 600 Watt und berechnet die anspruchsvollen Benchmarks mit 3.015 bis 3.045 MHz sowie einer Speicherleistung von 23 Gigatransfers pro Sekunde. Ob Sie von uns in den April geschickt wurden oder nicht, Sie haben auf jeden Fall echte Benchmarks gesehen, die aufzeigen, was eine High-End-Grafikkarte (mit tatsächlichen 100 TFLOPS) derzeit leisten kann. Mehr dazu im Auflösungsvideo:
Diese Überraschung ist Nvidia geglückt. Während alle Welt einen baldigen Launch der Geforce RTX 4070 erwartet und die mutmaßlichen Spezifikationen der noch kleineren Ada-Ableger diskutiert, veröffentlichen die Geforce-Macher kurzerhand die Titan A. Sie ist die Spitze der Nahrungskette, noch weit vor der Geforce RTX 4090 (PCGH-Test) angesiedelt, und soll sowohl Gaming-Enthusiasten als auch Kreativschaffende beglücken. PCGH prüft im Test der Nvidia Titan A, ob Spieler ihr Sparschwein schon wieder schlachten müssen - die UVP beläuft sich auf stolze 2.499 US-Dollar (wie zuletzt bei der Titan RTX) und somit hierzulande auf 2.749 Euro - selbstverständlich versandkostenfrei.
Bevor wir zu den großen Zahlen kommen, möchten wir ein paar Worte zum durchaus polarisierenden Äußeren der Titan A verlieren. Tatsächlich ist die Titan A nicht das erste Modell, dem Nvidia einen neuen Anstrich verpasst - im Gegenteil, viele Titan-Grafikkarten gingen ihr voraus. Da wäre beispielsweise die Geforce GTX Titan Black (2014), welche, noch sehr subtil, eine getönte "Frontscheibe" erhielt. Bei der Geforce GTX Titan X (2015) und Titan X (2016) wurden die Kalifornier bereits mutiger und tünchten den kompletten Kühler in Schwarz. Mit der Titan V (2017) hielt ein Gold-Imitat Einzug, das auch die Titan RTX (2018) aufweist. Nun vermischt Nvidia Gold- und Kryptonit-Staub, um die neueste Titan-Grafikkarte auch optisch auf die nächste Stufe zu hieven - das phosphoreszierende Komposit leuchtet im Dunkeln!
Quelle: PC Games Hardware
Nvidia Titan A: Dieses Rendering der Karte ist clever - es zeigt nämlich nicht, wie unheimlich breit die Karte ist (Kühlerhöhe effektiv: Quad-Slot).
Titan A im Test: Spezifikationen
100 Tera-FLOPS und 48 GiByte GDDR6X-Speicher: Zahlen, die jeden Nerd freudig umherspringen lassen. Faktisch handelt es sich bei der Nvidia Titan A um die erste Grafikkarte, welche 100 Billionen Gleitkomma-Operationen pro Sekunde ausführen kann. Daneben wirkt die Geforce RTX 4090 mit ihren knapp 83 TFLOPS und nur 24 GiByte Speicher wie ein blasses Spielzeug der letzten Generation. Um diese Kraft zu erhalten, treibt Nvidia seinen Gaming-Topdog, den AD102-Prozessor, zu neuen Höchstleistungen. Die Gerüchte rund um schmelzende Komponenten und jubilierende Energieversorger enthalten mit Sicherheit ein Körnchen Wahrheit. Überhaupt ist es sehr interessant, wie unterschiedlich die zahlreichen Gerüchte rund um die Titan A in den vergangenen Monaten lauteten. Einiges stimmt, vieles nicht. Faustregel: Glauben Sie Dinge erst, wenn Sie den PCGH-Test dazu lesen.
Um diese Kraft zu bändigen, vergrößert Nvidia den mit der Geforce RTX 4090 bereits aufgeblasenen Kühler erneut. Mit einem Kampfgewicht von 3.137 Kilogramm und vollen vier Slots Bauhöhe handelt es sich um die schwerste Referenzkarte der Gaming-Geschichte. Das kommt nicht von ungefähr, sondern ist der enormen Boardpower (TGP) von 666 Watt geschuldet. Zwar kam es nicht so schlimm wie von einigen Gerüchteköchen prophezeit - es waren 800 respektive 900 Watt im Gespräch -, so viel Energie will jedoch bereitgestellt und abgeführt werden. Gleich zwei der neuen 12VHPWR-Strombuchsen sitzen auf der Titan A, diese Vorab-Information stimmte. Nvidias Versuch des Greenwashings mit dem neuen Kühleranstrich scheitert bei einer derart durstigen Wuchtbrumme kläglich.
Zur Erinnerung: Für Ada Lovelace alias Geforce RTX 40 kehrt Nvidia "nach Hause" zum langjährigen Partner TSMC zurück. Die taiwanische Chip-Schmiede bietet die fortschrittlichste Technologie an und wurde für die Fertigung aller Ada-Prozessoren verpflichtet. Im Falle von AD102 sowie seinen kleinen Geschwistern AD103 und AD104 kommt eine "4N" genannte Custom-Version von TSMCs 5-Nanometer-Prozess zum Einsatz. Dank der signifikant kleineren Strukturbreite gegenüber Samsungs 8N kann Nvidia bei Ada Lovelace deutlich mehr Transistoren auf weniger Siliziumfläche unterbringen und im gleichen Atemzug die Taktraten um rund 50 Prozent steigern. Folgt man den offiziellen Zahlen zu Kerngröße und Transistormenge, so packt der AD102 mehr als 125 Millionen Schaltungen auf einen Quadratmillimeter, während es beim GA102 knapp 45 Millionen sind - eine Steigerung um Faktor 2,7. Bei den Vorgängern Turing (2018) und Pascal (2016) mit zeitgenössischer Fertigung waren es noch circa 25 Millionen Transistoren/mm². Werfen wir einen Blick auf alle leistungsrelevanten Parameter der Nvidia Titan im Vergleich mit der Geforce RTX 4090 und Konsorten:
| Grafikkarte | Titan A | Geforce RTX 4090 | Geforce RTX 4080 | Radeon RX 7900 XTX |
|---|---|---|---|---|
| Marktstart | 01.04.2023 | 12.10.2022 | 16.11.2022 | 13.12.2022 |
| Architektur | Ada Lovelace | Ada Lovelace | Ada Lovelace | RDNA 3 |
| Codename/Konfektion | AD102-350 | AD102-300 | AD103-300 | Navi 31 XTX |
| Chipgröße (Die/GCD) | 608,5 mm² | 608,5 mm² | 378,6 mm² | 300 mm² |
| Größe Memory Cache Dies (MCD) | - | - | - | 6× ~37 = 220 mm² |
| Transistoren Grafikchip (Mrd.) | 76,3 | 76,3 | 45,9 | 57,7 (inkl. MCDs) |
| Fertigungsverfahren | 4N | 4N | 4N | N5 (GCD) + N6 (MCD) |
| Shader-Cluster (CUs/SMs) | 140 | 128 | 76 | 96 |
| FP32-ALUs/TMUs/ROPs | 17.920/560/176 | 16.384/512/176 | 9.728/304/112 | 6.144/384/192 |
| Raytracing-Einheiten | 140 (3. Gen.) | 128 (3. Gen.) | 76 (3. Gen.) | 96 (2. Gen.) |
| Matrix-Einheiten | 560 (4. Gen.) | 512 (4. Gen.) | 304 (4. Gen.) | 192 (1. Gen.) |
| Level-2-Cache (MiB) | 88 | 72 | 64 | 6 |
| Level-3-Cache (MiB) | - | - | - | 96 |
| GPU-Boost-Takt in Spielen (MHz) | 2.810 | 2.520 | 2.505 | 2.300 |
| FP16-Leistung ALUs (TFLOPS) | 100,7 | 82,6 | 48,7 | 113 |
| FP32-Leistung ALUs (TFLOPS) | 100,7 | 82,6 | 48,7/0,76 | 56,5 |
| Füllrate (Mtex/Mpix pro Sek.) | 1.573,6/494,6 | 1.290,2/443,5 | 761,5/280,6 | 883,2/294,4 |
| Optical Frame Accelerator (TOPS) | ~340 | ~305 | ~305 | - |
| Speicheranbindung (Bit) | 384 | 384 | 256 | 384 |
| Geschwindigkeit RAM (GTs/MHz) | 24,0/12.000 | 21,0/10.502 | 22,4/11.200 | 20,0/10.000 |
| Speichertyp | GDDR6X | GDDR6X | GDDR6X | GDDR6 |
| Transferrate Speicher (GB/s) | 1.152 | 1.008 | 717 | 960 |
| Speicherkapazität (MiB) | 49.152 | 24.576 | 16.384 | 24.576 |
| PCI-Express-Standard | 4.0 ×16 | 4.0 ×16 | 4.0 ×16 | 4.0 ×16 |
| PCI-Express-Stromanschlüsse | 2× 16-/6× 8-Pol | 1× 16-/4× 8-Pol | 1× 16-/3× 8-Pol | 2× 8-Pol |
| Leistungsaufnahme (Board Power) | 666 Watt | 450 Watt | 320 Watt | 355 Watt |
| (Display-)Konnektivität | DP 1.4a, HDMI 2.1a | DP 1.4a, HDMI 2.1a | DP 1.4a, HDMI 2.1a | DP 2.1, HDMI 2.1a, USB-C |
| Unverbindlicher Preis (USD) | 2.499 | 1.599 | 1.199 | 999 |
| Unverbindlicher Preis (Euro) | 2.749 | 1.819 | 1.369 | 1.149 |
Angaben der Leistung jeweils mit typischem GPU-Boost laut Hersteller. Daten durch eigene Tests verifiziert. In der Praxis schwankt die Frequenz (in der Regel fällt sie höher aus) und daher auch der Durchsatz.
Pikant: Obwohl die Titan A sündteuer ist, spart Nvidia die besten AD102-Chips für das noch margenträchtigere Profi-Segment auf. Auf der Semi-Professional-Grafikkarte kommt lediglich ein AD102-350 zum Einsatz, welcher nicht dem Vollausbau entspricht. Die "Full Fat"-Konfektion des AD102 - eigentlich sehr passend zum Design der Titan A - beherbergt 12 Graphics Processing Clusters (GPCs), 72 Texture Processing Clusters (TPCs), 144 Streaming-Multiprozessoren (SMs) und somit 18.432 FP32-ALUs. Auf der Titan A sind davon 140 SMs und somit 17.920 FP32-ALUs aktiv - der Fast-Vollausbau der "Titan Classic" lässt grüßen. Auch beim Level-2-Cache knausert Nvidia, von den physisch vorhandenen 96 MiByte sind auf der Titan A nur 88 MiByte verfügbar, um auch Chips mit kleinen Fertigungsfehlern installieren zu können. Immerhin geizen die Kalifornier nicht am anschließenden Grafikspeicher: Dank 48 GiByte Kapazität und einer Datenrate von stolzen 24 Gigatransfers pro Sekunde bleibt kein Auge trocken.
Quelle: PC Games Hardware
AIDA64 GPGPU Benchmark: Nvidia Titan A vs. Geforce RTX 4090 vs. Geforce RTX 4080
In welcher Gaming-Leistung all diese Superlative münden, klären wir auf den folgenden, prallen Benchmark-Seiten. Der General-Purpose-Test des Systeminformations- und Test-Tools AIDA64 (oben abgebildet) bestätigt vorweg die Schlagkraft der Titan A - die 100-TFLOPS-Mauer ist tatsächlich gefallen.

Ich arbeite aktuell für einen Artikel u.a. mal wieder etwas mit der Unreal Engine 5.
Hier: Ein schlichtes Level, ein einziges (selbsterstelltes) Material (allerdings mit 9 unterschiedlichen, hochauflösenden Quixel-Untergründen/Untermaterialien, die ich mischen und auf die Landschaft aufpinseln kann) - bislang null Nanite-Assets, nur eine Landschaft und eine Handvoll Texturen: 24 GiByte Speicher sofort voll und zu wenig.
Gruß,
Phil
[Ins Forum, um diesen Inhalt zu sehen]