RDNA 4: Technik-Tauchgang

Test 11.07.2025 um 10:00 Uhr Raffael Vötter Als bevorzugte Quelle auf Google hinzufügen

In diesem Artikel

Die Radeon RX 9070 und RX 9070 XT waren die ersten Produkte auf Basis der RDNA-4-Generation, es folgten die RX 9070 GRE (bisher nur in China) und RX 9060 XT. AMD geht mit dieser Generation alle bekannten Flaschenhälse von RDNA 3 (Radeon RX 7000) an. Auf dieser Seite sehen wir erneut unter den Heatspreader - was macht RDNA 4 so schnell?

Quelle: AMD (Screenshot: PCGH) AMDs Vision = Pflichtenheft für RDNA 4 RDNA 4 hat bei der Leistung pro Recheneinheit gegenüber RDNA 3 sowohl beim Rasterizing als auch Raytracing und Machine Learning deutlich zugelegt. AMD attestiert RDNA 4 in etwa 40 Prozent mehr Rasterleistung, wobei diese sich zu gleichen Teilen aus einer höheren Taktfrequenz und einer höheren Leistung pro Taktzyklus, der sogenannten IPC-Rate ("Instructions per Cycle"), zusammensetzt. Die Raytracing-Performance soll indes um etwa 70 Prozent ansteigen, während der Leistungszuwachs im Hinblick auf KI alias Machine Learning sogar 100 Prozent betragen soll.

Quelle: AMD (Screenshot: PCGH) RDNA 4 CU

Aufgemotzte Raytracing-Rechenwerke

Was die Raytracing-Beschleunigung angeht, bleibt der Hersteller bei seinem bislang genutzten Konzept und ändert den Aufbau nicht grundlegend. So gibt es nach wie vor keine separaten Raytracing-Beschleuniger. AMDs Weg ist dabei ausdrücklich ein transistorsparender: Anstelle von dedizierten RT-Cores werden die Textureinheiten dazu befähigt, Ray-Intersection-Tests "in Teilzeit" durchzuführen. Bereits RDNA 3 weist zusätzliche Instruktionen gegenüber RDNA 2 auf, um diese Arbeit zu beschleunigen. Nvidia geht seit deren erster Raytracing-Generation (Turing) einen anderen Weg, bei dem separate, mächtige Fixed-Function-Einheiten diese und weitere Arbeiten übernehmen. Intel beschreitet bei Arc Alchemist seit 2022 den Weg Nvidias. Dennoch: Wie PCGH-Praxistests zeigen, hat AMD mit RDNA 4 erstmals eine Raytracing-Leistung, die der Konkurrenz pro Rechenwerk das Wasser reichen kann.

Quelle: AMD (Screenshot: PCGH) Architektur Im Vergleich zu RDNA 3 verfügt RDNA 4 über eine doppelt so hohe Intersection Rate. Damit ist es möglich, doppelt so schnell zu prüfen, ob einer der geschickten Strahlen auf etwas trifft. Auch das Ray Taversal arbeitet durch BVH8, welches BVH4 ablöst, doppelt so schnell, sodass Strahlen pro Taktzyklus nun doppelt so tief in die BVH-Struktur eindringen können, als das noch bei RDNA 3 der Fall war. Unter dem Strich verspricht der Hersteller, dadurch 70 Prozent mehr Raytracing-Performance zu liefern. Allein bis zu 10 Prozent mehr Raytracing-Performance sollen sich durch die sogenannten Oriented Bounding Boxes erzielen lassen, welche es ermöglichen, die BVH-Struktur an schräg im Raum platzierte Objekte anzupassen. Durch den Out of Order Memory soll sich zudem die Speicherlatenz reduzieren und die Renderpipeline effektiver auslasten lassen. Gleiches gilt ebenso für die KI-Beschleunigung, die sowohl Spieler als auch Creator adressieren soll.

KI-Unterstützung

Während RDNA 4 im Vergleich zu RDNA 3 und RDNA 3.5 (Mobile/APU) bei der KI-Beschleunigung von Gleitkommazahlen mit halber Genauigkeit (FP16) sowie Ganzzahlen (INT8) um den Faktor 2 respektive den Faktor 4 zulegt, wird unter Verwendung des Features "Sparsity", welches auf dünnbesetzte Matrizen, die sogenannten "Sparse Matrices", zurückgreifen kann, sogar die bis zu achtfache Rechenleistung für die Beschleunigung von Künstlicher Intelligenz bereitgestellt. Von diesem Leistungsplus im Hinblick auf die KI-Beschleunigung profitieren dank FSR 4 auch Spieler.

Quelle: AMD (Screenshot: PCGH) KI

FSR 4 als Gamechanger

AMDs neueste Upscaling-Technologie FSR 4 macht dank der Unterstützung von Künstlicher Intelligenz ("KI") und Maschinellem Lernen ("ML") einen großen Schritt nach vorn und wird dadurch konkurrenzfähiger zum Klassenprimus DLSS von Nvidia. AMD verspricht für die Kombination aus dem neuen FidelityFX Super Resolution 4 und Frame Generation eine nochmals deutlich bessere Bildqualität bei gleichzeitig niedrigerer Latenz. Trainiert wird der FSR-4-Algorithmus dafür auf AMD Instinct-GPUs. In Kombination mit Frame Generation sollen sich die Frameraten in 4K/UHD ("2160p") im Performance-Mode um das bis zu 3,7-fache steigern lassen. Doch auch ganz ohne Zwischenbildberechnung soll FSR 4 einen großen Leistungssprung erzielen. FSR 4 ist RDNA-4-GPUs vorbehalten, RDNA 3 und älter wird, Stand jetzt, nicht mit dem Verfahren bedacht, da die älteren Rechenwerke nicht die notwendige Leistung für das aufwendige Verfahren bereitstellen.

Empfohlener redaktioneller Inhalt [EMBED_URL] An dieser Stelle finden Sie externe Inhalte von [PLATTFORM]. Zum Schutz Ihrer persönlichen Daten werden externe Einbindungen erst angezeigt, wenn Sie dies durch Klick auf "Alle externen Inhalte laden" bestätigen: Ich bin damit einverstanden, dass mir externe Inhalte angezeigt werden. Damit werden personenbezogene Daten an Drittplattformen übermittelt. Mehr dazu in unserer Datenschutzerklärung.

Externe Inhalte Mehr dazu in unserer Datenschutzerklärung.

PCI-Express 5.0 ×16

Weitere Neuerungen betreffen unter anderem die Media Engine sowie PCI-Express-Anbindung. Letztere lautet bei bislang allen RDNA-4-Modellen "PCI-Express 5.0 ×16", die Hardware ist somit bestmöglich an das restliche System angebunden. Nachdem wir bei der Radeon RX 9060 XT zuletzt kuriose Beobachtungen gemacht haben, fühlten wir auch der Radeon RX 9070 GRE ausführlich auf die PCIe-Kontakte. Was wir dabei herausfanden, sieht tadellos aus.

Quelle: PCGH PCI-Express Transfer Rate/Throughput: Radeon RX 9070 GRE Während 9060-XT-Grafikkarten auch mit dem neuesten Treiber niedrige Leseraten ausspucken, arbeitet die Radeon RX 9070 GRE konsequent mit der höchstmöglichen Geschwindigkeit. Unterschiede zwischen 9070, 9070 GRE und 9070 XT liegen im Rahmen der Messtoleranz. Das sind gute Neuigkeiten, denn die Radeon RX 9070 GRE muss mit 12 GiByte VRAM haushalten, was den einen oder anderen Speicherüberlauf zur Folge haben kann. Davon und mehr handeln die kommenden Seiten voller Spiele-Benchmarks.

- Kommentare (51)
  Zur Diskussion im Forum
  
  Von Gurdi Kokü-Junkie (m/w)
  
  Schade dass es die Karte derzeit nicht in D gibt. Wäre eine spannende Alternative in dem Preisbereich.
  
  Zitat von Olstyle
  
  Das Wissen scheint veraltet zu sein.
  Zumindest bei den 8GB Karten hat TPU das Gegenteil beobachtet
  
  [Ins Forum, um diesen Inhalt zu sehen]
  
  Zitat von shaboo
  
  Zumindest Raff spricht im vorliegenden Test nach wie vor von "besserem Speichermanagement" bei Nvidia.
  
  Ist halt die Frage, unter welchen Testbedingungen TPU zu dieser Erkenntnis kam, ob sie sich von 8 GB auf andere VRAM-Größen übertragen lässt, und ob andere unabhängige Tests zu ähnlichen Ergebnissen kamen. Ich höre das so auf jeden Fall zum ersten Mal.
  
  Die Anzahl der Lanes spielt hier eine Rolle. Um das genauer zu prüfen, müsste man beide Karte auf die selbe Bandbreite setzen. Hab das kürzlich mal ausgewertet, generell scheint NV mit der Speicherverwaltung noch einen My effizienter zu sein. Wenn der Speicher dann abschließend aber nicht mehr reicht, ist die Karte mit mehr Lanes natürlich im Vorteil. Man müsste das mal sauber auswerten, die GRE eignet sich eigentlich ganz gut dafür.
  
  Zitieren
  
  Von Gurdi Kokü-Junkie (m/w)
  
  Schade dass es die Karte derzeit nicht in D gibt. Wäre eine spannende Alternative in dem Preisbereich.
  
  Zitat von Olstyle
  
  Das Wissen scheint veraltet zu sein.
  Zumindest bei den 8GB Karten hat TPU das Gegenteil beobachtet
  
  [Ins Forum, um diesen Inhalt zu sehen]
  
  Zitat von shaboo
  
  Zumindest Raff spricht im vorliegenden Test nach wie vor von "besserem Speichermanagement" bei Nvidia.
  
  Ist halt die Frage, unter welchen Testbedingungen TPU zu dieser Erkenntnis kam, ob sie sich von 8 GB auf andere VRAM-Größen übertragen lässt, und ob andere unabhängige Tests zu ähnlichen Ergebnissen kamen. Ich höre das so auf jeden Fall zum ersten Mal.
  
  Die Anzahl der Lanes spielt hier eine Rolle. Um das genauer zu prüfen, müsste man beide Karte auf die selbe Bandbreite setzen. Hab das kürzlich mal ausgewertet, generell scheint NV mit der Speicherverwaltung noch einen My effizienter zu sein. Wenn der Speicher dann abschließend aber nicht mehr reicht, ist die Karte mit mehr Lanes natürlich im Vorteil. Man müsste das mal sauber auswerten, die GRE eignet sich eigentlich ganz gut dafür.
  
  Zitieren
  
  Von Svenc Software-Overclocker(in)
  
  Zitat von plusminus
  
  Was dann schlimmer ist mit GPU seitig 30 - 40 FPS rumruckeln oder Artefakte und Bildfehler wegen fehlendem Vram ist egal .
  
  Du erkennst die Quereinsteiger sofort, die erst in den letzten 10-20 Jahren durchgestartet sind mit PC-Gaming -- wir hatten ja damals nichts. (Spaß beiseite: Auf Konsole sind 30-40 Bilder jede einzelne Sekunde ja immer noch ein "akzeptierter" Standard -- und Doom knatterte mit seinem 35er-Lock genau in der Mitte. Aufm PC hingegen pushte Nvidia neulich kräftig die 1.000-Hz-Bildschirme. Denn hier ist noch was an Wachstumspotenzialen zu wecken).
  
  Zitieren
  
  Von Cleriker Kokü-Junkie (m/w)
  
  Zitat von shaboo
  
  Weil die Leute ja pausenlos nur Indiana Jones oder Doom spielen ...
  
  Die Vorteile einer 5070 gegenüber einer 9070 GRE sind doch offensichtlich, sinnloses Cherrypicking hin oder her. Natürlich profitiert man von ihnen - je nach präferierten Titeln und Einstellungen - mal mehr und mal weniger, aber im Zweifel gilt wie immer: Besser haben als brauchen. Eine bessere Speicherverwaltung bei 12 GB VRAM sowieso. Dass man persönlich für 'nen Fuffi darauf zu verzichten würde, mag ja sein, aber deswegen muss der Rest der Welt das ja nicht genauso sehen.
  
  Jetzt bleib mal locker und halt dich zurück mit deinen haltlosen Anschuldigungen!
  Es wurden als Beispiel PT-Games genannt (von Pu224) und ich habe kein Kirschenpflücken betrieben, sondern deshalb die letzten beiden großen Titel genommen die auch im Parcour sind, damit wir immer aktuelle Zahlen vergleichen können und daran aufgezeigt, dass der genannte Vorteil eben arg begrenzt ist.
  Er liegt genaues dort, wo auch andere Karten schon genug FPS liefern um halbwegs ordentlich zu spielen.
  Beispielsweise bei Spielen die schon ausreichend FPS bringen, aber man einfach mehr aus seinem 240Hz Display herausholen möchte. Klarer Punkt. Das verstehe ich durchaus. Auch Titel, wo man sich gerade so im Übergang zwischen spielbar und nicht spielbar befindet.
  
  Ich für meinen Teil empfinde das aber als zu geringen Vorteil aktuell und das ist meine Meinung und kein Befehl an die Welt, so wie du das scheinbar empfunden hast. Der Beitrag von mir war sachlich und ohne Wertung, falls dir das entgangen ist in deiner "Beurteilung" dessen.
  
  Schau mal:
  Wir haben die genannten und von mir eingegrenzten Vorteile, die man sich mit 50€ höherer Investitionssummer erkauft. das kann einem gefallen oder nicht. Dazu gesellen sich aber zuletzt immer mehr Berichte und userthreads über Probleme mit den Treiben, die es bei RTX4000 so nicht gab in der Zahl und die ich vor der 5080 mit der 7900XTX auch nicht hatte. Oben drauf empfinde ich die Produktpolitik bei RTX5000 als nicht geil. das sind bessere 4000 Super Ti, in meinen Augen und hätten nicht für solche Preise erscheinen dürfen.
  Das zusammen ergibt diese Wertung meinerseits und das kann doch jeder für sich selbst anders werten. Es ist doch nicht so, als müssten wir alle ein und der Gleichen Meinung sein. Also:
  
  Zitieren
  
  Von plusminus BIOS-Overclocker(in)
  
  Zitat von Olstyle
  
  Das Wissen scheint veraltet zu sein.
  Zumindest bei den 8GB Karten hat TPU das Gegenteil beobachtet
  
  [Ins Forum, um diesen Inhalt zu sehen]
  
  Du meinst sicher das die Ideologie veraltet ist .
  
  Wer seine Grafikarte entsprechend der verbauten GPU Leistung und VRAM Ausstattung sinnvoll nutzt , und je nach Geldbeutel für diese , die Grafik Einstellungen im Game anpasst kann flüssig Spass haben .
  
  Die Meinung das viel Vram die Karte in etwa auf das Niveau eines nächst schnelleren Modell,s mit weniger Vram heben kann oder das die Karte Jahre länger ohne einbußen neue Games 60 FPS + packt kann man vergessen , wie PCGH Test,s immer wieder Faktisch zeigen .
  
  Was dann schlimmer ist mit GPU seitig 30 - 40 FPS rumruckeln oder Artefakte und Bildfehler wegen fehlendem Vram ist egal .
  
  Die Karte hat dann eben ausgedient .
  
  Zitieren
  
  Von Svenc Software-Overclocker(in)
  
  Zitat von MechUnit
  
  Mit jetzt noch 12 GB scheint sie auch eher was für den chinesischen Markt zu sein.
  
  Da war die RNDA2-GRE damals interessanter.
  
  Gemach, gemach!
  
  Nach der 4GB-6500XT-Legende kommt jetzt erst mal die 9070 ZERO.
  
  [Ins Forum, um diesen Inhalt zu sehen]
  
  Zitieren
  
  Direkt zum Diskussionsende