RDNA 4: Unter der Haube (Technik)
In diesem Artikel
- Seite 1 Übersicht & Daten
- Seite 2 RDNA 4: Unter der Haube (Technik)
- Seite 3 Spiele-Benchmarks & Leistungsindex
- Seite 4 Raytracing-Benchmarks & Leistungsindex
- Seite 5 Pathtracing-Benchmarks & Leistungsindex
- Seite 6 Leistungsaufnahme, Effizienz & Tuning
- Seite 7 Preis-Leistung (Raster & Raytracing) & Fazit
- Seite 8 Bildergalerie
Die Radeon RX 9070 und RX 9070 XT sind die ersten Produkte auf Basis der RDNA-4-Generation. AMD geht damit alle bekannten Flaschenhälse von RDNA 3 (Radeon RX 7000) an. Auf dieser Seite sehen wir unter den Heatspreader - was macht RDNA 4 so schnell?
RDNA 4 hat bei der Leistung pro Recheneinheit (Compute Unit) gegenüber RDNA 3 sowohl beim Rasterizing als auch Raytracing und Machine Learning deutlich zugelegt. Im Pflichtenheft standen die folgenden Punkte:
- Weitreichend optimiert für anspruchsvolle Gaming-Workloads
- Stark verbesserte Rasterleistung und Recheneffizienz
- Ein deutlicher Leistungssprung in der Raytracing-Performance
- Umfassende Hochleistungsunterstützung für Maschinelles Lernen
- Verbesserte Bandbreiteneffizienz für sämtliche Workloads
- Multimedia-Verbesserungen für Spiele und Creator
Quelle: AMD (Screenshot: PCGH)
AMD Radeon RX 9070 & RX 9070 XT mit RDNA 4 im Test: Eine faustdicke Überraschung! (1)
AMD attestiert RDNA 4 in etwa 40 Prozent mehr Rasterleistung, wobei diese sich zu gleichen Teilen aus einer höheren Taktfrequenz und einer höheren Leistung pro Taktzyklus, der sogenannten IPC-Rate ("Instructions per Cycle"), zusammensetzt. Der AIDA64 GPGPU-Benchmark klopft die wichtigsten Disziplinen ab:
Quelle: PCGH
AIDA64 GPGPU Benchmark (obere Reihe: RX 9070 XT, RX 9070, RTX 4070 TiS; untere Reihe: RX 7900 XT, RX 7900 XTX, "RX 9070 XTX" = XT MAX-OC)
Die Raytracing-Performance soll dabei um etwa 70 Prozent ansteigen, während der Leistungszuwachs im Hinblick auf KI alias Machine Learning sogar 100 Prozent betragen soll. Doch mit welchen Änderungen hat AMD diese Leistungssprünge erzielt? Der 356,5 mm² große Grafikprozessor verfügt über 53,9 Milliarden Transistoren und damit über eine enorm hohe Transistordichte von 151 Millionen Schaltungen pro mm². Neben schnelleren FP32-ALUs, die über deutlich höhere Taktfrequenzen und mehr Leistung pro Taktzyklus verfügen, halten die folgenden Neuerungen Einzug:
- Echtzeit-Raytracing der 3. Generation
- Matrix-Beschleuniger der 3. Generation
- KI-Beschleuniger der 2. Generation
- Optimierte Cache-Hierarchie
KI, überall KI!
Während RDNA 4 im Vergleich zu RDNA 3 und RDNA 3.5 (Mobile/APU) bei der KI-Beschleunigung von Gleitkommazahlen mit halber Genauigkeit (FP16) sowie Ganzzahlen (INT8) um den Faktor 2 respektive den Faktor 4 zulegt, wird unter Verwendung des Features "Sparsity", welches auf dünnbesetzte Matrizen, die sogenannten "Sparse Matrices", zurückgreifen kann, sogar die bis zu achtfache Rechenleistung für die Beschleunigung von Künstlicher Intelligenz bereitgestellt. Von diesem Leistungsplus im Hinblick auf die KI-Beschleunigung profitiert dank FSR 4 dann letztlich auch der Spieler.
Quelle: AMD (Screenshot: PCGH)
AMD Radeon RX 9070 & RX 9070 XT mit RDNA 4 im Test: Eine faustdicke Überraschung! (7)
Aufgebohrte Ray Accelerators
Was die Raytracing-Beschleunigung angeht, bleibt der Hersteller bei seinem bislang genutzten Konzept und ändert den Aufbau nicht grundlegend. So gibt es nach wie vor keine separaten Raytracing-Beschleuniger, auch RDNA 4 nutzt Schaltungen in den Textureinheiten, die sich "in Teilzeit" darum kümmern. Deshalb spricht AMD auch gar nicht erst von Raytracing-Beschleunigern der 3. Generation, sondern nur von "3rd Gen Raytracing". AMD hingegen geht einen transistorsparenden Weg: Egal ob RDNA 2 (erste RT-Generation) oder RDNA 3 (zweite Generation), anstelle von dedizierten RT-Cores werden die Textureinheiten dazu befähigt, Ray-Intersection-Tests durchzuführen. RDNA 3 weist zusätzliche Instruktionen gegenüber RDNA 2 auf, um diese Arbeit zu beschleunigen. Die Umsetzung erweist sich leistungsfähig genug für moderates Raytracing, bricht jedoch zusammen, wenn die GPU mit anspruchsvollem Rasterizing plus komplexem Raytracing voll ausgelastet ist - dann bremsen die überarbeiteten TMUs das Geschehen aus. Intel beschreitet bei Arc Alchemist seit 2022 übrigens den Weg Nvidias.
Im Vergleich zu den RDNA 3 verfügt RDNA 4 jedoch über eine doppelt so hohe Intersection Rate. Damit ist es jetzt möglich, doppelt so schnell zu prüfen, ob einer der geschickten Strahlen auf etwas trifft. Auch das Ray Taversal arbeitet durch BVH8, welches BVH4 ablöst, doppelt so schnell, sodass Strahlen pro Taktzyklus nun doppelt so tief in die BVH-Struktur eindringen können, als das noch bei RDNA 3 der Fall war. Unter dem Strich verspricht der Hersteller, dadurch 70 Prozent mehr Raytracing-Performance zu liefern. Allein bis zu 10 Prozent mehr Raytracing-Performance sollen sich durch die sogenannten Oriented Bounding Boxes erzielen lassen, welche es ermöglichen, die BVH-Struktur an schräg im Raum platzierte Objekte anzupassen. Durch den Out of Order Memory soll sich zudem die Speicherlatenz reduzieren und die Renderpipeline effektiver auslasten lassen. Gleiches gilt ebenso für die KI-Beschleunigung, die sowohl Spieler als auch Creator adressieren soll.
Quelle: AMD (Screenshot: PCGH)
AMD Radeon RX 9070 & RX 9070 XT mit RDNA 4 im Test: Eine faustdicke Überraschung! (3)
FSR 4 als der Game Changer
AMDs neueste Upscaling-Technologie FSR 4 soll dank der Unterstützung von Künstlicher Intelligenz ("KI") und Maschinellem Lernen ("ML") einen großen Schritt nach vorn machen und damit auch endlich deutlich konkurrenzfähiger zum aktuellen Klassenprimus DLSS von Nvidia werden. AMD verspricht für die Kombination aus dem neuen FidelityFX Super Resolution 4 und Frame Generation eine nochmals deutlich bessere Bildqualität bei gleichzeitig niedrigerer Latenz. Trainiert wird der FSR-4-Algorithmus dafür auf AMD Instinct-GPUs.
Mehr Leistung, niedrigere Latenzen und vor allem eine durch Künstliche Intelligenz und Maschinelles Lernen signifikant bessere Bildqualität sind AMDs erklärte Ziele für FSR 4. In Kombination mit Frame Generation sollen sich die Frameraten in 4K/UHD ("2160p") im Performance-Mode um das bis zu 3,7-fache steigern lassen. Doch auch ganz ohne Zwischenbildberechnung soll FSR 4 einen großen Leistungssprung erzielen.
Quelle: AMD (Screenshot: PCGH)
AMD Radeon RX 9070 & RX 9070 XT mit RDNA 4 im Test: Eine faustdicke Überraschung! (8)
Pathtracing auf AMD? Ja!
Zudem geht AMD das Thema Pathtracing mit Neural Supersampling und einem Denoiser an, was in Zukunft auf eine eigene Lösung als Gegenspieler zu DLSS Ray Reconstruction hindeutet. Hierzu hat der Hersteller allerdings noch keine Details genannt.
Weitere Neuerungen
Weitere Neuerungen betreffen die aktualisierte PCI-Express-Anbindung sowie die Media Engine. Video-Streams sollen mit HEVC- und AV1-Codec durch die neuen Dual-Encoder-Einheiten qualitativ besser werden, während der H.264-Codec jetzt bei geringen Bitraten deutlich besser aussehen soll als noch auf RDNA 3. AMD verspricht eine bis zu 25 Prozent höhere Bildqualität. Hierzu haben wir noch keine Tests durchgeführt, den PCI-Express haben wir jedoch schon auf den Teststand geschickt:
Quelle: PCGH
Radeon RX 9070 & RX 9070 XT: PCI-Express Throughput
WIe Sie sehen, erreichen die Radeon RX 9070 und RX 9070 XT rund 55 GByte/s am Slot, was einer Verdoppelung gegenüber PCI-Express 4.0 entspricht - wie es die Spezifikation vorsieht. Gerne hätten wir auch RTX-5000-Grafikkarten zum Vergleich geladen, allerdings müssten wir dafür einen Intel-Unterbau verwenden, auf dem leicht andere Ergebnisse erzielt werden. Ursächlich ist, dass nach wie vor kein Testprogramm mit der Kombination aus AMD-Chipsatz und Geforce RTX 5000 korrekt funktioniert.
- Seite 1 Übersicht & Daten
- Seite 2 RDNA 4: Unter der Haube (Technik)
- Seite 3 Spiele-Benchmarks & Leistungsindex
- Seite 4 Raytracing-Benchmarks & Leistungsindex
- Seite 5 Pathtracing-Benchmarks & Leistungsindex
- Seite 6 Leistungsaufnahme, Effizienz & Tuning
- Seite 7 Preis-Leistung (Raster & Raytracing) & Fazit

Daran hatte ich nicht gedacht, wahrscheinlich, weil ich die FPS in die Karte unterfordernden Spielen auf 120 oder 60 FPS begrenze. Außerdem Denkfehler, weil die 9070 in Auslastung nicht mehr Strom verbraucht, als die 6700 XT. Da hat sich ja in Sachen Effizienz schon was getan.
Was soll ich sagen: RT benutze ich nicht. Mit einer 6900 XT und 4K macht das einfach keinen Sinn, weil es für die Karte einfach viel zu viel ist.
Aber mit WaKü Block nicht so einfach.
Würde auch gerne meine 4070ti super wechseln, aber 5070ti, 9070xt können sich nicht spürbar absetzen. Selbst eine 5080 wäre eher als absolutes minimum, um es merken zu können anzusehen. Das aber zu Aufpreisen, das man doch wieder keinen Spaß hat. Steht für bis zu 25% mehr Leistung, in keinem Verhältnis.