Warum Radeon RX 9000 ein großer Wurf ist: RDNA 3 vs. RDNA 4 im Pro-Takt-Duell
Schluss mit den Gedankenspielen, her mit den Fakten: Wir haben erstmals getestet, wie stark AMDs neue RDNA-4-Architektur gegenüber dem Vorgänger RDNA 3 ist - und verzeichnen gigantische Zuwächse, die nicht nur Grafik-Geeks interessieren dürften.
Auf dieser Seite
Mit der Radeon RX 9060 XT debütierte just ein brandneuer Grafikchip: Navi 44. Der kleine Bruder von Navi 48, besser bekannt als Radeon RX 9070 (XT), bringt das fortschrittliche RDNA-4-Funktionspaket in die Grafikkarten-Mittelklasse. Vergleicht man die beiden GPUs, entspricht Navi 44 bei fast allen leistungsrelevanten Punkten einem halbierten Navi 48: 2.048 anstelle von 4.096 Shader-Einheiten, 128 statt 256 Bit zum Speicher, 32 statt 64 MiByte Level-2-Cache. Die Erfahrung lehrt, dass dies nicht gleichbedeutend mit halbierter Leistung ist, denn diverse Skalierungseffekte verhindern in den allermeisten Fällen eine verdoppelte Leistung bei Verdoppelung der Rechenwerke - ein schmaler Chip lässt sich leichter auslasten als ein breiter. Alle Details lesen Sie im 40.000 Zeichen starken PCGH-Test der Radeon RX 9060 XT 16GB, an dieser Stelle schalten wir einen Gang hoch und wollen eine lange im Raum stehende Frage beantworten: Wie viel stärker ist RDNA 4 gegenüber RDNA 3?
Praxistest: RDNA 4 vs. RDNA 3
Wir wissen seit dem Release der Radeon RX 9070 & XT, dass AMDs neue RDNA-4-Architektur pro Rechenwerk deutlich mehr leistet als RDNA 3. Der genaue Zugewinn ließ sich jedoch nur schätzen - bis jetzt. Mit Navi 44, also der Radeon RX 9060 XT, ist ein beinahe perfektes Versuchskaninchen erschienen, um Direktvergleiche mit der Radeon RX 7600 XT anzustellen. Bei beiden GPUs - Navi 44 und Navi 33 - handelt es sich um Monolithen mit je zwei Raster-Engines, 2.048 Dual-Issue-fähigen FP32-Einheiten und einer 128-Bit-Verbindung zum Speicher. Neben dem Aufbau der Rechenwerke trennt die beiden nur Takt - und ein weiteres Detail, das wir mithilfe von synthetischen Tests verifizieren konnten: Navi 44 verfügt über 4 MiByte Level-2-Zwischenspeicher, Navi 33 nur über 2 MiByte. Dieses Detail verhilft Navi 44 zu einer deutlich höheren effektiven Speichertransferrate. Danach kommen, mit absteigender Hierarchie, in beiden Fällen 32 MiByte L3-Cache sowie 16 GiByte GDDR6-Speicher.
Für den folgenden Vergleich haben wir je eine Radeon RX 9060 XT 16GB und eine Radeon RX 7600 XT 16GB auf 3 GHz Chiptakt gesetzt (das neue Modell folglich untertaket, das alte Modell übertaktet). Beim Speicher gelang uns bedauerlicherweise keine Takt-Parität, da sich der VRAM einer 9060 XT nicht untertakten lässt und wir bei der 7600 XT knapp an den notwendigen 2.500 MHz Command Clock scheitern. Da der L2-Cache ohnehin massive Auswirkungen hat, verbuchen wir die minimale Abweichung als nicht relevant und kommen direkt zu den Ergebnissen, von reinem Rasterizing, über Raytracing, hin zu Pathtracing (durchweg Full HD/1080p):
Wichtig: Dank 16 GiByte liegt zu keiner Zeit ein Limit durch die Speicherkapazität vor, wir sehen hier die reine Grafikkarten-Leistung! Spätestens an dieser Stelle wird deutlich, welch großer Wurf RDNA 4 ist. Die Vorgänger-Architektur rechnet in ihrer besten Form - schmal, hochtaktend und nicht durch Chiplets ausgebremst - und ist dennoch massiv unterlegen.
Dabei beherzigt die Benchmarkauswahl das sehr unterschiedliche Abschneiden von RDNA 4 gegenüber RDNA 3. So zeigen etwa Baldur's Gate 3, Outcast: A New Beginning und Hunt: Showdown 1896 den Worst-Case für die neue Architektur, während die anderen Tests besonders hohe Gewinne bescheinigen. Besonders eindrücklich ist das Geschehen in Cyberpunk 2077: Mit Raytracing wird ein Leistungsplus von 78 Prozent erreicht, mit Pathtracing sogar 130 Prozent. Die übrigen der insgesamt 43 aktuellen PCGH-Benchmarks skalieren irgendwo dazwischen. Falls Sie es genauer wissen möchten, klicken Sie gerne die Benchmarks im Test der Radeon RX 9060 XT 16GB durch und entfernen Sie alle anderen Grafikkarten als die 9060 XT und 7600 XT. Hier ist der Takt zwar nicht angeglichen, aber die Differenzen zwischen dem alten und neuen Modell zeigen, wohin die Reise geht.
RDNA 4 vs. RDNA 3: Fazit
Mithilfe der zielgerichteten Benchmarks konnte erstmals abseits der AMD-Labore nachgewiesen werden, dass die RDNA-4-Architektur pro Rechenwerk deutliche Fortschritte gemacht hat. Dabei ist vor allem die Evidenz im Kontext Raytracing wertvoll. Die Daten zeigen unmissverständlich, dass AMDs frühere Raytracing-Schwäche nicht auf Nvidia-affinen Code, sondern tatsächlich auf die zuvor schwachen Rechenwerke zurückzuführen ist. Beim traditionellen Rasterizing sind die Zuwächse kleiner, teilweise weniger als zehn Prozent, allerdings in vielen Fällen dennoch beachtlich. Blickt man auf die ansehnliche Skalierung von Navi 44 (9060 XT) auf Navi 48 (9070 XT), schmerzt der Mangel einer High-End-Lösung besonders. Ein hypothetischer Navi 41 mit nochmals verdoppelter Rechenleistung hätte zweifellos das Potenzial, es mit Nvidias GB202 alias Geforce RTX 5090 aufzunehmen.
Radeon RX 9060 XT: Impressionen aus dem Test
Wir hoffen, dass Ihnen dieser Ausflug ins Land der GPU-Innereien gefallen hat. Falls ja, bringen wir künftig mehr solcher Analysen und garnieren diese - nach Möglichkeit - außerdem mit den Ergebnissen von Profiling-Tools, um genauer sagen zu können, was wann und wo limitiert. Bis dahin: Was halten Sie von der RDNA-4-Architektur? Besser als Nvidias RTX Blackwell oder nicht? Nutzen Sie die Kommentarfunktion und teilen Sie uns Ihre Meinung mit. Beachten Sie beim Kommentieren aber bitte die Forenregeln. Folgen Sie uns außerdem für Neuigkeiten in der Hardware-Welt oder unsere exklusiven Inhalte gern auf Whatsapp und X. Unsere Video-Inhalte (oftmals gewürzt mit einer Prise Humor) finden Sie bei Youtube, Instagram und Tiktok.

[Ins Forum, um diesen Inhalt zu sehen]
Man sieht also ganz gut, dass der kleinere 70er Chip von AMD es optimiert sogar fast mit einer größeren 5080 aufnehmen kann, selbst in Cyberpunk sieht es stark aus.
Und spätestens die 9070 zeigt es dann allen Nvidia Karten, dass AMD mit der Effizienz Top sein kann.
Und mit -150mv und +10% wirds noch besser.
Andererseits schafft man es aber damit trotz der extrem schwachen Vorgaben von Nvidia nicht, sich aus deren Windschatten zu lösen. Letztlich gibt's gleichen VRAM, ähnliche Leistung und ähnliche Effizienz; bei RT/PT und Features ist man etwas hinten, beim Preis etwas vorne - in der Summe damit business as usual, so dass dieser "große Wurf" auf die Marktanteile keine großen Auswirkungen haben wird. Und ob man auf eventuelle Super-Varianten Nvidias, die bereits in einem halben Jahr in den Läden stehen könnten, eine passende Antwort haben wird, das wird man auch erst noch sehen müssen.
Zwar machen Preise hier zwar die (Haupt-)Unterschiede. Aber das sind mitunter längst vergleichsweise (Luxus-)Preiskategorien, in denen Preiskämpfe längst nicht mehr so ziehen wie damals, als um jeden Cent gefeilscht wurde -- oder es auch für Spiele brauchbare Grafikkarten bereits ab/bis 100 Euro gab. Der Entry des Marktes ist natürlich preisbewusst. Deshalb sind ja auch die günstigsten Karten weiterhin unter den Bestsellern, also RTX 3050, 3060, 4060 sowie RX 6600, 7600... Aber das mitunter schlicht, weil sie die günstigsten Karten sind. ~400 Euro ist noch mal eine ganz andere Kategorie. Oder anders: Jemand, der nicht viel Geld ausgeben will oder kann, steckt nicht alleine ~400 Tacken in eine Grafikkarte.
Klar, 70-80 Euro sind Geld. Quasi ein ganzes, neues AAAAA-Game. Aber tendenziell würde ich es davon nicht mehr zwingend abhängig machen. 370 Euro? 450 Euro? 750 Euro oder 850? Zumal die Grafikkarte heuer oft für Jahre im Rechner bleibt. Früher musste sie gezwungenermaßen nach ein paar Spielesaisons schon wieder in den Ruhestand, weil die Nachfolger sie bereits lange überholt hatten. Und auch noch ein paar Games explizit dafür programmiert wurden -- und nicht für fünf Jahre alte Konsolen sowie PC-Mittelklassehardware.
Wer einen sehr viel größeren Fuß in die Tür will, muss vermutlich ZWINGEND eigene USPs an den Start bringen, statt zu "kopieren". Wie sie AMD bei den Prozessoren etwa mit der größeren Kernzahl gegenüber Intel oder dem 3D-Cache hatte. Und der muss natürlich Unterstützung finden. FSR5 könnte als Upscaling-Variante dreimal so gut wie DLSS sein -- wenn Software-Hersteller es nicht annehmen würden, würde es sich nicht durchsetzen. Hier sitzt AMD eigentlich an einem guten Hebel, solange sie die Hardware der Konsolen bauen.
Andererseits schafft man es aber damit trotz der extrem schwachen Vorgaben von Nvidia nicht, sich aus deren Windschatten zu lösen. Letztlich gibt's gleichen VRAM, ähnliche Leistung und ähnliche Effizienz; bei RT/PT und Features ist man etwas hinten, beim Preis etwas vorne - in der Summe damit business as usual, so dass dieser "große Wurf" auf die Marktanteile keine großen Auswirkungen haben wird. Und ob man auf eventuelle Super-Varianten Nvidias, die bereits in einem halben Jahr in den Läden stehen könnten, eine passende Antwort haben wird, das wird man auch erst noch sehen müssen.
Das einzige Segment, in dem ich AMD klar vorne sehe, ist der um 650 bis 700 Euro, in dem sich die 5070 mit ihrer - gegenüber der 9070 - fatalen VRAM-Schwäche tummelt. Aber um einer 5060Ti oder 5070Ti das Wasser abzugraben, wird's mehr brauchen als das, was wir bislang von AMD gesehen haben. Dafür hängen einfach zu viele bei Nvidia fest.
Die Spieler fordern eine RX 9080 XT mit 24 GB VRAM oder >!!!!!!!!!
"Kauft keine RX 9070 XT mehr!"
[Ins Forum, um diesen Inhalt zu sehen]
Der einzig echte Fortschritt- wie immer man den bewerten mag - ist MFG.
Generell werden die Verbesserungen in der Performance allein immer kleiner werden in der Zukunft. Einfach weil die Möglichkeiten langsam ausgereizt sind.
AMD hat noch etwas mehr Potential, da sie noch was aufzuholen haben, speziell bei AI und RT. Wenn da die Lücke geschlossen ist, wird eher wenig passieren fürchte ich.
Sowohl in LLM/ML-Anwendungen als auch bei extremen Auflösungen in VR ist die 5090 meilenweit vor der 4090.
Der Rest ist ok, ich bin sehr froh den Schritt von 4090 auf 5090 (plus 4 3090 in 2 NVLink-Paaren) gemacht zu haben.
Jetzt freue ich mich erst mal wenn die neune TRs mit 3DVcache kommen, dan wachsen Workstation und GamingPC final zusammen.