Geforce RTX 4090 vs. Radeon RX 7900 XTX: Duell der Topmodelle - Nachtest 2024 [Update]
Nvidias Geforce RTX 4090 ist schneller als AMDs Radeon RX 7900 XTX, das ist allgemein bekannt. Doch mit jedem neuen Treiber wandert die Nachkommastelle, weshalb wir die Flaggschiffe zum Nachtest bitten: Wie sehen die Machtverhältnisse im März 2024 aus?
In diesem Artikel
Aktualisierung vom 13.03.2024: Mittlerweile haben wir aufgrund des hohen Interesses auch ein Video zur 2024er-Neuauflage des High-End-Duells zwischen RTX 4090 und RX 7900 XTX veröffentlicht. Sie finden dieses weiter unten im Artikel.
Die Zeit fliegt: Die amtierenden GPU-Architekturen Nvidia Ada Lovelace und AMD RDNA 3 sind seit bald 1,5 Jahren am Markt. Den Anfang machte Nvidia mit der Geforce RTX 4090, welche im Oktober 2022 debütierte und seitdem auf dem Leistungsthron sitzt. Das im Dezember 2022 gestartete AMD-Topmodell Radeon RX 7900 XTX kann zwar Achtungserfolge verbuchen und die Geforce RTX 4080 Super in Schach halten, unterliegt der Nvidia-Speerspitze jedoch klar.
Soweit der aktuelle Kenntnisstand - doch stimmt das eigentlich noch? Schließlich pressen die Hersteller durch kontinuierliche Treiber-Updates immer mehr Leistung aus ihren Produkten. Gefragt, getan. Wir haben die beiden GPU-Titanen Geforce RTX 4090 und Radeon RX 7900 XTX erneut auf den Teststand geschnallt und mit brandneuen Grafiktreibern in vier Auflösungen durch unsere 26 Benchmarkspiele mit und ohne Raytracing gescheucht. Man könnte diesen Vergleich für unfair halten, denn die eine Grafikkarte kostet beinahe das Doppelte der anderen (konkret: RTX 4090 ab 1.789 Euro, Radeon RX 7900 XTX ab 949 Euro). Wir halten den Vergleich dennoch für naheliegend und spannend, denn er zeigt, was derzeit bestenfalls möglich ist - außerdem hat das günstigere Modell die Chance, bei der Preis-Leistungs-Betrachtung zu punkten.
Bildergalerie
Geforce RTX 4090 gegen Radeon RX 7900 XTX
Bevor wir uns den Benchmarks widmen, möchten wir die Erinnerung an unsere Probanden auffrischen. Wie eingangs erläutert, stammen beide High-End-Grafikkarten und zugrundeliegenden Architekturen aus dem Jahr 2022. Mit einer Ablöse ist frühestens im Herbst dieses Jahres zu rechnen, im Falle von Nvidia gilt sogar Anfang 2025 für die neue Generation Blackwell (RTX 5000) als wahrscheinlich. Bis dahin kann man mit einer Geforce RTX 4090 (Ada Lovelace) und Radeon RX 7900 XTX (RDNA 3) viel flüssigen Spaß haben, den wir auf den folgenden Seiten aufzeigen.
Die beiden Grafikkarten sind zwar grundverschieden, in Teilbereichen aber vergleichbar. Da wäre die Speicherkapazität von jeweils 24 GiByte zu nennen, welche auch zukünftigen Spielen problemlos standhalten wird und jeweils mit einem runden Terabyte pro Sekunde angebunden ist. Die übrigen Eckdaten unterscheiden sich stark und sind maßgeblich für die Leistungsunterschiede in Spielen verantwortlich. So führt Nvidia 16.384 vollwertige FP32-Rechenwerke ins Feld, welche mit den typischen Taktraten eine stolze Rechenleistung von knapp 90 Tera-FLOPS bereitstellen. AMD setzt hingegen auf 6.144 dieser Rechenwerke, welche unter bestimmten Umständen - mittels der Dual-Issue-Funktion - den doppelten Durchsatz und somit bestenfalls 65 TFLOPS erreichen können. Als RDNA 3 startete, entbrannten einige Diskussionen darüber, warum AMD nicht den letzten Meter geht und "echte" 12.288 FP32-Einheiten installiert. Der Grund dafür ist Platz, denn jede Fertigkeit kostet Transistoren, RDNA 3 ist jedoch stark flächenoptimiert. Die Spezifikationen der schnellsten Grafikkarten neben ihren Geschwistern; weitere Vergleichsmodelle finden Sie in unserer gepflegten GPU-Datenbank:
| Grafikkarte | Geforce RTX 4090 | Radeon RX 7900 XTX | Geforce RTX 4080 Super |
|---|---|---|---|
| Referenzkarte verfügbar? | Ja | Ja | Ja |
| Marktstart | 12.10.2022 | 13.12.2022 | 31.01.2024 |
| Architektur | Nvidia Ada Lovelace | AMD RDNA 3 | Nvidia Ada Lovelace |
| Codename/Konfektion | AD102-300 | Navi 31 XTX | AD103-400 |
| Chipgröße (Die/GCD) | 608,5 mm² | 300 mm² | 378,6 mm² |
| Größe Memory Cache Dies (MCD) | - | 6× ~37 = 220 mm² | - |
| Transistoren Grafikchip (Mrd.) | 76,3 | 57,7 (inkl. MCDs) | 45,9 |
| Fertigungsverfahren | 4N | N5 (GCD) + N6 (MCD) | 4N |
| Shader-Cluster (CUs/SMs) | 128 | 96 | 80 |
| FP32-ALUs/TMUs/ROPs | 16.384/512/176 | 6.144*/384/192 | 10.240/320/112 |
| Raytracing-Einheiten | 128 (3. Gen.) | 96 (2. Gen.) | 80 (3. Gen.) |
| Matrix-Einheiten | 512 (4. Gen.) | 192 (1. Gen.) | 320 (4. Gen.) |
| Level-2-Cache (MiB) | 72 | 6 | 64 |
| Level-3-Cache (MiB) | - | 96 | - |
| GPU-Boost-Takt in Spielen (MHz) | 2.740 | 2.600 | 2.730 |
| FP16-Leistung ALUs (TFLOPS) | 89,8 | 127,8 | 55,9 |
| FP32-Leistung ALUs (TFLOPS) | 89,8 | 63,9 | 55,9 |
| Füllrate (Mtex/Mpix pro Sek.) | 1.402,9/482,2 | 998,4/499,2 | 873,6/305,8 |
| (DLSS 3) Frame Generation | Ja | Nein | Ja |
| Treiber-Frame-Generation | Nein | Ja | Nein |
| Speicheranbindung (Bit) | 384 | 384 | 256 |
| Geschwindigkeit RAM (GTs/MHz) | 21,0/10.502 | 20,0/10.000 | 23,0/11.500 |
| Speichertyp | GDDR6X | GDDR6 | GDDR6X |
| Transferrate Speicher (GB/s) | 1.008 | 960 | 736 |
| Speicherkapazität (MiB) | 24.576 | 24.576 | 16.384 |
| PCI-Express-Standard | 4.0 ×16 | 4.0 ×16 | 4.0 ×16 |
| Stromanschlüsse | 1× 16-/4× 8-Pol | 2× 8-Pol | 1× 16-/2- bis 3× 8-Pol |
| Leistungsaufnahme (Board Power) | 450 Watt | 355 Watt | 320 Watt |
| Display-Konnektivität | DP 1.4a, HDMI 2.1a | DP 2.1, HDMI 2.1a, USB-C | DP 1.4a, HDMI 2.1a |
| Preis zum Testzeitpunkt (ab) | 1.790 | 950 | 1.100 |
Angaben der Leistung auf Basis der von uns ausführlich durchgetesteten Grafikkarten (durchschnittlicher GPU-Boost über alle Benchmarks) - die Herstellerangaben liegen teils deutlich und somit praxisfern darunter. Je nach Modell sind Abweichungen um bis zu 200 MHz möglich. *ALUs mit "Dual-Issue"-Fertigkeit, welche sich bestenfalls verhalten wie die doppelte Anzahl. Angegeben ist der Best-Case.
Die Frage, inwiefern der Shader-Compiler des Treibers reifen und somit öfter die RDNA-3-Leistung mittels Dual-Issue auf die Straße bringen kann, können wir heute mit neuen Daten aufgreifen, aber nicht abschließend beantworten. Ende 2022 waren sich unsere synthetischen Mess-Tools einig, dass Dual-Issue nicht von allein genutzt wird, sodass wir konsequent TFLOPS-Ergebnisse im 30er-Bereich zu Gesicht bekamen. Mit den Monaten und Updates der AMD Software Adrenalin besserte sich der Zustand und seit einiger Zeit bescheinigt auch der General-Purpose-Test von AIDA64 eine klare Wirkung - die aktuellen Ergebnisse:
Quelle: PCGH
Theoretische Leistungswerte - AIDA64 General Purpose Benchmark: Geforce RTX 4090 vs. Radeon RX 7900 XTX vs. Geforce RTX 4080 Super
Man kann folglich annehmen, dass die Radeon RX 7900 XTX sowie ihre Geschwister beim Gaming nun besser abschneiden als früher. Doch die Konkurrenz schläft nicht und auch wenn Nvidia nicht explizit mit Leistungsverbesserungen wirbt, wurden diese zweifellos erreicht, wie unsere stetigen Nachmessungen belegen. Damit genug der Vorrede - auf den folgenden Seiten erfahren Sie, wie die Radeon RX 7900 XTX gegen die Geforce RTX 4090 beim Rasterizing und Raytracing abschneidet. Und falls Sie bis hierhin denken, dass dieser Vergleich unfair ist, können Sie selbstverständlich auch kleinere Grafikkarten wie die Geforce RTX 4080 Super mit in die Betrachtung nehmen.

Würde ich jetzt aber eine kaufen wäre es die 7900. Einfach weil sie weit günstiger ist.
Ich bin davon abgekommen zu kaufen bei erscheinen. Da warte ich lieber bis die Preise runter gehen. Die habe ich erst gekauft kurz bevor die raus kamen.
Muss aber dazu sagen das auf den PC ein WQHD Monitor hängt und ich da nicht wirklich einen Grund sehe mir da einen 4K zukaufen.
Ja, das ist sehr effizient.
Ist selbst innerhalb des ADA lineups die 4090 sehr ineffizient was Shader Einheiten zu Performance angeht.
Die 4080 hat etwas mehr als die hälfte der Shader (ca 60%) ist aber im schnitt nur 35 % Langsamer.
4080 Shader:
9728
4090:
16384
Ja, das ist sehr effizient.