Nvidia Geforce RTX 4090 im Test: So powerful, it's kinda ridiculous! [Update]

Aktualisiert: Bis zu Leistungsfaktor 2 beim Rasterizing, Faktor 4 dank DLSS-3-Upsampling und verdoppelte Energie-Effizienz: Nvidia bewirbt seine neue Speerspitze Geforce RTX 4090 mit großer Selbstsicherheit. PCGH prüft im ausführlichen Test der RTX 4090, welche Errungenschaften die neue Ada-Lovelace-Architektur wirklich mitbringt.

539

Test 12.10.2022 um 16:14 Uhr Raffael Vötter Als bevorzugte Quelle auf Google hinzufügen

Quelle: PC Games Hardware

In diesem Artikel

Aktualisierung vom 12.10.2022: Wie angekündigt, haben Nvidia und seine Boardpartner heute den Verkauf der RTX 4090 (Founders Edition und Custom Designs) gestartet. Die Nachfrage war offenbar hoch, denn die interessanten Angebote, speziell die FE-ähnlichen Einsteiger-Designs für 1.949 Euro, waren sehr schnell ausverkauft. Mehr Details liefert der Liveticker zu den Angeboten. Der Launch war also bisher durchaus erfolgreich, auch wenn natürlich nicht klar ist, welche Menge die Shops zur Verfügung hatten. Falls Sie sich fragen, ob es die Founders von Nvidia auch zu kaufen gab: Wenn, dann nur wenige Sekunden oder Minuten, denn wir haben sie trotz F5-Drückens nur als "derzeit nicht verfügbar" erblickt.

Alle zwei Jahre ist es so weit: Eine neue Geforce-Generation erblickt das Licht der Welt. Heute fällt der offizielle Startschuss für "Ada Lovelace", mit der Nvidia die nunmehr dritte RTX-Generation einläutet. Im Gepäck haben die Kalifornier markige Versprechen rund um den größten Leistungssprung in der Firmengeschichte. Letztere sind, wie immer bei Launches, fantasievoll konstruiert, doch auch in der Realität ist die Geforce RTX 4090 mit großem Abstand die leistungsfähigste Gaming-Grafikkarte, welche PCGH je getestet hat. Im Folgenden verraten wir, was das 1.949-Euro-Schlachtschiff RTX 4090 bei klassischem Rasterizing und modernem Raytracing leistet, wie es um die Energie-Effizienz steht und welche Features sowie Fallstricke auf Interessenten warten.

Wichtiger Hinweis: Unsere Erfahrungen mit DLSS 3 (Grafikqualität und Benchmarks) bekommen Sie in einem mittlerweile veröffentlichten, zweiten Artikel zur RTX 4090.

Empfohlener redaktioneller Inhalt [EMBED_URL] An dieser Stelle finden Sie externe Inhalte von [PLATTFORM]. Zum Schutz Ihrer persönlichen Daten werden externe Einbindungen erst angezeigt, wenn Sie dies durch Klick auf "Alle externen Inhalte laden" bestätigen: Ich bin damit einverstanden, dass mir externe Inhalte angezeigt werden. Damit werden personenbezogene Daten an Drittplattformen übermittelt. Mehr dazu in unserer Datenschutzerklärung.

Externe Inhalte Mehr dazu in unserer Datenschutzerklärung.

Geforce RTX 4090 im Test: Next-Gen

Wir sind uns bewusst, dass sich die Bezeichnung "Next Generation" (nächste Generation) mit der Zeit abnutzt - im Falle der Geforce RTX 4090 ist sie jedoch angebracht. Erreicht wird der riesige Sprung nicht etwa durch einen radikal umgebauten Shader-Core, sondern durch eine so alte wie effektive Methode: AD102, Herz und Motor der Geforce RTX 4090, beherbergt nicht nur mehr Rechenwerke als sein Vorgänger GA102, sondern außerdem einen deutlich erhöhten Takt. Möglich wird dies durch eine signifikante Verbesserung der Fertigungstechnologie. Bei Ampere (Geforce RTX 30) setzte Nvidia vor zwei Jahren auf die Geschicke von Samsung, welche das "8N" genannte Verfahren bereitstellten. Der Prozess galt bereits im Jahr 2020 als zweite Wahl in den Disziplinen Packdichte und Taktpotenzial und somit als Ursache für die schwache Energie-Effizienz von Ampere sowie die relativ großen Grafikchips.

Bildergalerie

Für Ada Lovelace alias Geforce RTX 40 kehrt Nvidia "nach Hause" zum langjährigen Partner TSMC. Die taiwanische Chip-Schmiede bietet die fortschrittlichste Technologie an und wurde für die Fertigung aller Ada-Prozessoren verpflichtet. Im Falle von AD102 sowie seinen für November erwarteten Geschwistern AD103 sowie AD104 kommt eine "4N" genannte Custom-Version von TSMCs 5-Nanometer-Prozess zum Einsatz. Dank der signifikant kleineren Strukturbreite gegenüber Samsungs 8N kann Nvidia bei Ada Lovelace deutlich mehr Transistoren auf weniger Siliziumfläche unterbringen und im gleichen Atemzug die Taktraten um rund 50 Prozent steigern. Folgt man den offiziellen Zahlen zu Kerngröße und Transistormenge, so packt der AD102 mehr als 125 Millionen Schaltungen auf einen Quadratmillimeter, während es beim GA102 knapp 45 Millionen sind - eine Steigerung um Faktor 2,7. Bei den Vorgängern Turing (2018) und Pascal (2016) mit zeitgenössischer Fertigung waren es noch circa 25 Millionen Transistoren/mm². Werfen wir einen Blick auf alle leistungsrelevanten Parameter der Geforce RTX 4090 im Vergleich mit dem Besten der alten Garde:

Grafikkarte	RTX 4090	RTX 3090 Ti	RTX 3090	RTX 3080 Ti	RX 6900 XT LC	RX 6900 XT
Marktstart	12.10.2022	29.03.2022	24.09.2020	03.06.2021	Q2 2021 (OEM)	08.12.2020
Architektur	Ada Lovelace	Ampere	Ampere	Ampere	RDNA 2	RDNA 2
Codename/Konfektion	AD102-300	GA102-350	GA102-300	GA102-225	Navi 21 XTXH	Navi 21 XTX
Chipgröße (reiner Die)	608,5 mm²	628,4 mm²	628,4 mm²	628,4 mm²	520 mm²	520 mm²
Transistoren Grafikchip (Mio.)	76.300	28.300	28.300	28.300	26.800	26.800
Fertigungsverfahren (Foundry)	4N (TSMC)	8N (Samsung)	8N (Samsung)	8N (Samsung)	N7 (TSMC)	N7 (TSMC)
Shader-Cluster (CUs/SMs)	128	84	82	80	80	80
FP32-ALUs/TMUs/ROPs	16.384/512/176	10.752/336/112	10.496/328/112	10.240/320/112	5.120/320/128	5.120/320/128
Raytracing-Einheiten	128 (3. Gen.)	84 (2. Gen)	82 (2. Gen.)	80 (2. Gen.)	80 (1. Gen.)	80 (1. Gen.)
Tensor-Kerne	512 (4. Gen.)	336 (3. Gen.)	328 (3. Gen.)	320 (3. Gen.)	-	-
Level-2-Cache (MiB)	72	6	6	6	4	4
Level-3-Cache (MiB)	-	-	-	-	128	128
GPU-Boost-Takt in Spielen (MHz)	2.520	1.860	1.695	1.665	2.250	2.015
FP16-Leistung ALUs (TFLOPS)	82,6	40,0	35,6	34,1	46,1	41,3
FP32/FP64-Leistung ALUs (TFLOPS)	82,6/1,29	40,0/0,63	35,6/0,56	34,1/0,53	23,0/1,44	20,6/1,29
Füllrate (Mtex/Mpix pro Sek.)	1.290,2/443,5	625,0/208,3	556,0/189,8	532,8/186,5	720,0/288,0	644,8/257,9
Optical Frame Accelerator (TOPS)	~305	~126	~115	~113	-	-
Speicheranbindung (Bit)	384	384	384	384	256	256
Geschwindigkeit RAM (GTs/MHz)	21,0/10.502	21,0/10.502	19,5/9.752	19,0/9.502	18,4/9.200	16,0/8.000
Speichertyp	GDDR6X	GDDR6X	GDDR6X	GDDR6X	GDDR6	GDDR6
Transferrate Speicher (GB/s)	1.008	1.008	936	912	589	512
Speicherkapazität (MiB)	24.576	24.576	24.576	12.288	16.384	16.384
PCI-Express-Standard	4.0	4.0	4.0	4.0	4.0	4.0
PCI-Express-Stromanschlüsse	1× 16-/4× 8-Pol	1× 16-/3× 8-Pol	1× 12-/2× 8-Pol	1× 12-/2× 8-Pol	2× 8-Pol	2× 8-Pol
Leistungsaufnahme (Board Power)	450 Watt	450 Watt	350 Watt	350 Watt	350 Watt	300 Watt
Unverbindlicher Launch-Preis (UVP)	1.949 Euro	2.249 Euro	1.649 Euro	1.269 Euro	Keiner (nur OEM)	~1.080 Euro

Angaben der Leistung jeweils mit typischem GPU-Boost laut Hersteller. Daten durch eigene Tests und Nachfrage bei AMD/Nvidia verifiziert. In der Praxis schwankt die Frequenz (in der Regel fällt sie höher aus) und daher auch der Durchsatz.

Auch lesenswert: Geforce RTX 4090 kaufen: Hier lässt sich Nvidias neue Top-Grafikkarte ab 12.10. bestellen

Wie Sie sehen, ist bei der Geforce RTX 4090 fast alles zahlreicher und schneller - die Leistungsaufnahme bleibt jedoch auf dem Niveau der RTX 3090 Ti. Letztere legte vor sechs Monaten die Messlatte nach oben und galt als Vorbereitung für Ada, was die Geforce RTX 4090 in Sachen Leistungsaufnahme, Kühlung und Platinendesign bestätigt - dazu gleich mehr.
Quelle: PC Games Hardware Nvidia Geforce RTX 4090 Founders Edition: Spec Overview

Bei der theoretischen Rohleistung, welche stets ein Produkt aus Breite und Höhe (Einheitenmenge und Takt) ist, erreicht Nvidia mit offiziellen Taktraten mehr als den Faktor 2. Von diesem Sprung war die Geforce RTX 3090 gegenüber der RTX 2080 Ti abseits der reinen FP32-Leistung weit entfernt und hinzukommt, dass Takt erfahrungsgemäß besser in Leistung umgesetzt wird als zusätzliche Rechenwerke. Interessanterweise legt die Geforce RTX 4090 um exakt null Prozent zu, was die Leistung des Grafikspeichers angeht - ist das kein Bremsklotz? Grundsätzlich lautet die Antwort darauf "ja", sofern keine Maßnahmen in anderen Chip-Teilen unternommen werden - und diese hat Nvidia ergriffen: AD102 beinhaltet im Vollausbau 16× so viel Level-2-Zwischenspeicher wie GA102 - 96 anstelle von 6 MiByte.

Falls Sie das an AMDs Vorstoß mit dem "Infinity Cache" genannten Level-3-Zwischenspeicher innerhalb der RDNA-2-GPUs erinnert, sind Sie auf dem richtigen Dampfer. Hüben wie drüben hilft der große Zwischenspeicher dabei, wichtige Daten stets neben den Rechenwerken zu haben, anstelle den langen und energieintensiven Umweg Richtung Grafikspeicher zu gehen. Bedauerlicherweise nennt Nvidia auch auf mehrfache Nachfrage keine Zahlen zum GPU-internen Durchsatz und den Hit Rates (Erfolgsquote, etwas im Cache zu finden), allerdings lassen die Benchmarks auf eine sehr effiziente Lösung schließen. Sie sind zu Recht neugierig, doch bevor wir die Fps-Werte ausbreiten, widmen wir uns auf der nächsten Seite weiteren Features und Errungenschaften von Ada Lovelace.