Radeon RX 9070 XT und 9070: AMD erklärt die Leistungssprünge in Raster und Raytracing

Im Rahmen des "Architecture Deep Dive" erläutert AMD seine neue Mikroarchitektur RDNA 4 sowie die darauf basierenden Grafikprozessoren Navi 4X und deren Featureset im Detail und erklärt, wie die in Aussicht gestellten Leistungssprünge bei der Raster- und Raytracing-Leistung realisiert werden.

Special 03.03.2025 um 15:15 Uhr Sven Bauduin Als bevorzugte Quelle auf Google hinzufügen

Quelle: AMD

Im Rahmen des "Architecture Deep Dive" erläutert AMD in Person von Andrew Pomianowski, Senior Vice President für Silicon Design Engineering ("SVP"), seine neue GPU-Mikroarchitektur RDNA 4 ("GFX12") sowie die darauf basierenden Grafikprozessoren Navi 48 XTX ("GFX1201") und Navi 48 XT ("GFX1201") und deren Featureset im Detail und erklärt, wie die in Aussicht gestellten Leistungssprünge bei der Raster- und Raytracing-Leistung realisiert werden konnten. Später soll dann zwei weitere Ableger mit Navi 44 ("GFX1200") folgen.

Performance per Compute Unit

RDNA 4 soll bei der Leistung pro Recheneinheit, der Performance per Compute Unit, gegenüber RDNA 3 sowohl bei der Rasterleistung als auch der Raytracing-Performance und ML-Leistung deutlich zugelegt haben. Die Vision für die Architektur sah dabei wie folgt aus.

Weitreichend optimiert für anspruchsvolle Gaming-Workloads
Stark verbesserte Rasterleistung und Recheneffizienz
Ein deutlicher Leistungssprung in der Raytracing-Performance
Umfassende Hochleistungsunterstützung für Maschinelles Lernen
Verbesserte Bandbreiteneffizienz für sämtliche Workloads
Multimedia-Verbesserungen für Spiele und Creator

Die selbst gesteckten Ziele möchte AMD mit der RDNA-4-Architektur erfolgreich abgehakt haben, wie der Vergleich der relativen Leistungsfähigkeit von RDNA 2, RDNA 3 und RDNA 4 im Hinblick auf die eingangs erwähnte Performance per Compute Unit verdeutlichen soll.

Quelle: AMD AMD sieht seine "RDNA 4 Vision" im Hinblick auf Rasterleistung, Raytracing-Performance und KI-/ML-Leistungsfähigkeit als erfüllt an, doch welche architektonischen Änderungen waren hierfür notwendig? Die Umbauarbeiten fielen durchaus umfangreich aus, wie AMD im Architecture Deep Dive erläutert und anhand eines GPU-Diagramms verdeutlicht.

Im Fokus der Radeon Technologies Group ("RTG"), der Technikabteilung rund um RDNA 4 und die Radeon RX 9070 Series, lagen die Compute Units, die AMD gegenüber RDNA 3 massiv umgebaut wurden, um deren Leistung zu erhöhen.
AMD attestiert RDNA 4 in etwa 40 Prozent mehr Rasterleistung, wobei diese sich zu gleichen Teilen aus einer höheren Taktfrequenz und einer höheren Leistung pro Taktzyklus, der sogenannten IPC ("Instructions per Cycle") zusammensetzt.
Die Raytracing-Performance soll dabei um etwa 70 Prozent ansteigen, während der Leistungszuwachs im Hinblick auf KI und ML sogar 100 Prozent betragen soll.

Doch mit welchen Änderungen an Navi 4X ("GFX12") im Vergleich zu Navi 3X ("GFX11") möchte AMD diese Leistungssprünge letztlich erzielt haben?

Umfangreiche Umbauarbeiten

Am Beispiel des Navi 48 XTX der Radeon RX 9070 XT demonstriert AMD die umfangreichen Umbauarbeiten, die das Unternehmen aus Santa Clara vorgenommen hat. Der 356,5 mm² große Grafikprozessor verfügt über 53,9 Milliarden Transistoren und damit über eine vergleichsweise hohe Transistordichte von 151 Millionen Schaltungen pro mm².

Neben schnelleren FP32-ALUs, die über deutlich höhere Taktfrequenzen und mehr Leistung pro Taktzyklus ("IPC") verfügen, halten die folgenden Neuerungen Einzug:

Echtzeit-Raytracing der 3. Generation
Matrix-Beschleuniger der 3. Generation
KI-Beschleuniger der 2. Generation
Ein optimiertes Cache-System

Die beiden weitreichendsten, wenn auch bei Weitem nicht einzigen Änderungen an den Compute Units ("CUs") finden sich beim Raytracing und der KI-Beschleunigung respektive dem ML-Support wieder.

Während RDNA 4 im Vergleich zu RDNA 3 und RDNA 3.5 bei der KI-Beschleunigung binärer Fließkommazahlen mit einer halben Genauigkeit ("FP16") sowie binärer Ganzzahlen mit einer Genauigkeit von 63-Bit ("INT8") um den Faktor 2x respektive den Faktor 4x zulegt, wird unter Verwendung des Features "Sparsity", welches auf dünnbesetzte Matrizen, die sogenannten "Sparse Matrices", zurückgreifen kann, sogar die bis zu achtfache Rechenleistung für die Beschleunigung von Künstlicher Intelligenz bereitgestellt. Von diesem Leistungsplus im Hinblick auf die KI-Beschleunigung profitiert dank FSR 4 dann letztlich auch Spieler.

Quelle: AMD Was die Raytracing-Beschleunigung angeht, bleibt der Hersteller aber bei seinem bislang genutzten Konzept und ändert den Aufbau dahingehend nicht. So gibt es nach wie vor keine separaten Raytracing-Beschleuniger, auch RDNA 4 nutzt Hardware in den Textureinheiten, um Raytracing-Lasten entsprechend zu beschleunigen. Deshalb spricht AMD auch gar nicht erst von Raytracing-Beschleunigern der 3. Generation, sondern nur von "3rd Gen Raytracing".

Quelle: AMD Im Vergleich zu den Navi-3X-GPUs verfügen die Navi-4X-GPUs allerdings über eine doppelt so hohe Intersection Rate. Damit ist es jetzt möglich, doppelt so schnell zu prüfen, ob einer der geschickten Strahlen auf etwas trifft. Auch das Ray Taversal arbeitet durch BVH8, welches BVH4 ablöst, doppelt so schnell, sodass Strahlen pro Taktzyklus nun doppelt so tief in die BVH-Struktur eindringen können, als das noch bei RDNA 3 der Fall war. Unter dem Strich verspricht der Hersteller, dadurch 70 Prozent mehr Raytracing-Performance zu liefern.

Quelle: AMD (Screenshot: PCGH)

Allein bis zu 10 Prozent mehr Raytracing-Performance sollen sich durch die sogenannten Oriented Bounding Boxes erzielen lassen, welche es ermöglichen, die BVH-Struktur an schräg im Raum platzierte Objekte anzupassen. Durch den Out of Order Memory soll sich zudem die Speicherlatenz reduzieren und die Renderpipeline effektiver auslasten lassen. Gleiches gilt ebenso für die KI-Beschleunigung, die sowohl Spieler als auch Creator adressieren soll.

Quelle: AMD (Screenshot: PCGH)

Quelle: AMD (Screenshot: PCGH)

Dank der stark erweiterten Unterstützung für das Maschinelle Lernen ("ML"), welches auf RDNA 4 um bis zu 100 Prozent schneller beschleunigt wird als noch auf RDNA 3, wird auch erst der potenzielle Game Changer, die KI-gestützte Upscaling-Technologie, möglich.

FSR 4 als der Game Changer

AMDs neueste Upscaling-Technologie FSR 4 soll dank der Unterstützung von Künstlicher Intelligenz ("KI") und Maschinellem Lernen ("ML") einen großen Schritt nach vorn machen und damit auch endlich deutlich konkurrenzfähiger zum aktuellen Klassenprimus DLSS von Nvidia werden. AMD verspricht für die Kombination aus dem neuen FidelityFX Super Resolution 4 und Frame Generation eine nochmals deutlich bessere Bildqualität bei gleichzeitig eine niedrigere Latenz. Trainiert wird der FSR-4-Algorithmus dafür auf AMD Instinct-GPUs.

Quelle: AMD Mehr Leistung, niedrigere Latenzen und vor allem eine durch Künstliche Intelligenz und Maschinelles Lernen signifikant bessere Bildqualität sind AMDs erklärte Ziele für FSR 4. In Kombination mit Frame Generation sollen sich die Frameraten in 4K/UHD ("2160p") im Performance-Mode um das bis zu 3,7-fache steigern lassen. Doch auch ganz ohne Zwischenbildberechnung soll FSR 4 einen großen Leistungssprung erzielen.

Quelle: AMD Zudem geht AMD das Thema Pathtracing mit Neural Supersampling und einem Denoiser an, was in Zukunft auf eine eigene Lösung als Gegenspieler zu DLSS Ray Reconstruction hindeutet. Hierzu hat der Hersteller allerdings noch keine Details genannt.

Neue Videoeinheiten

Speziell für RDNA 4 sowie die darauf basierenden Navi-4X-Grafikprozessoren hat AMD auch die Videoeinheiten, die sogenannten Media Engines, überarbeitet. Streams sollen mit HEVC- und AV1-Codec durch die neuen Dual-Encoder-Einheiten qualitativ besser werden, während der H.264-Codec jetzt bei geringen Bitraten deutlich besser aussehen soll als noch auf den Navi-3X-Grafikprozessoren. AMD verspricht eine bis zu 25 Prozent höhere Bildqualität.

Quelle: AMD Weitere Informationen zur Radeon RX 9070 XT und Radeon RX 9070, welche am 6. März in den Handel kommen werden, liefert unser ausführliches Video zur Vorstellung der beiden insbesondere an Spieler adressierten RDNA-4-Grafikkarten.

Empfohlener redaktioneller Inhalt [EMBED_URL] An dieser Stelle finden Sie externe Inhalte von [PLATTFORM]. Zum Schutz Ihrer persönlichen Daten werden externe Einbindungen erst angezeigt, wenn Sie dies durch Klick auf "Alle externen Inhalte laden" bestätigen: Ich bin damit einverstanden, dass mir externe Inhalte angezeigt werden. Damit werden personenbezogene Daten an Drittplattformen übermittelt. Mehr dazu in unserer Datenschutzerklärung.

Externe Inhalte Mehr dazu in unserer Datenschutzerklärung.

Ihre Meinung ist bitte!

Wie stehen Sie zu diesem Thema? Die PCGH-Redaktion freut sich über Ihre fundierte Meinung in den Kommentaren zu dieser Meldung. Um zu kommentieren, müssen Sie auf PCGH.de oder im Extreme-Forum eingeloggt sein. Sollten Sie bisher noch keinen Account haben, könnten Sie sich hier unverbindlich registrieren. Beachten Sie beim Kommentieren aber bitte die geltenden Forenregeln.

Quelle: AMD

Artikel teilen

Radeon RX 9070 XT und 9070: AMD erklärt Leistungssprünge Im Rahmen des "Architecture Deep Dive" erläutert AMD seine neue Mikroarchitektur RDNA 4 sowie die darauf basierenden Grafikprozessoren Navi 4X und deren Featureset im Detail und erklärt, wie die in Aussicht gestellten Leistungssprünge bei der Raster- und Raytracing-Leistung realisiert werden.

Per E-Mail versenden

- Kommentare (78)
  Zur Diskussion im Forum
  
  Von MechUnit Software-Overclocker(in)
  
  Zitat von Thomas5010
  
  Es geht ja nicht nur um Spiele...
  
  AMD wirbt mit einer besseren KI Leistung. Für lokale KIs ist VRAM Pflicht. 16GB sind nicht viel. Hiermit sind nur rudimentäre Modelle lauffähig.
  
  Auch bei Videobearbeitung ist weniger VRAM ein Problem.
  
  Also, wenn der Grafikkartenbesitzer in Zukunft auf die Idee kommt seine Grafikkarte anderweitig zu benutzen, dann sind die Limits brutal da.
  
  Aber sind dann für solche Zwecke ohnehin Workstation-GPU's nicht besser geeignet, statt gamer-Karten, die auch als solche verkauft und vermarktet werden?
  
  Wenn ich von mir ausgehe, plane ich ja den GPU-Kauf entsprechend und überlege mir, ob ich die GPU z.B. 1 Jahr später für was anderes nutzen möchte und treffe dahingehend meine Kaufentscheidung.
  
  Aber wenn ich dann doch was anderes mit der GPU machen möchte, was nicht in meine vorherigen Überlegungen einfloss, kann ich die GPU ja austauschen.
  
  Zitieren
  
  Von MechUnit Software-Overclocker(in)
  
  Zitat von Thomas5010
  
  Es geht ja nicht nur um Spiele...
  
  AMD wirbt mit einer besseren KI Leistung. Für lokale KIs ist VRAM Pflicht. 16GB sind nicht viel. Hiermit sind nur rudimentäre Modelle lauffähig.
  
  Auch bei Videobearbeitung ist weniger VRAM ein Problem.
  
  Also, wenn der Grafikkartenbesitzer in Zukunft auf die Idee kommt seine Grafikkarte anderweitig zu benutzen, dann sind die Limits brutal da.
  
  Aber sind dann für solche Zwecke ohnehin Workstation-GPU's nicht besser geeignet, statt gamer-Karten, die auch als solche verkauft und vermarktet werden?
  
  Wenn ich von mir ausgehe, plane ich ja den GPU-Kauf entsprechend und überlege mir, ob ich die GPU z.B. 1 Jahr später für was anderes nutzen möchte und treffe dahingehend meine Kaufentscheidung.
  
  Aber wenn ich dann doch was anderes mit der GPU machen möchte, was nicht in meine vorherigen Überlegungen einfloss, kann ich die GPU ja austauschen.
  
  Zitieren
  
  Von Inras Software-Overclocker(in)
  
  Zitat von Kosi
  
  Ich würde hier tatsächlich nur noch jemanden zur XTX raten, der auch in der Zukunft kein FSR4 nutzen möchte oder halt nur Games zockt, die auch so ohne Upscaling/FG gut laufen.
  
  Wobei ich hoffe und auch glaube, dass AMD noch mit der Unterstützung von FSR4 für die RDNA3 GPUs ums Eck kommt. Dran rumbasteln tun sie ja.
  
  Zitieren
  
  Von Apfelkind Freizeitschrauber(in)
  
  Zitat von Thomas5010
  
  Das beste Setting ist viel VRAM und Features. Das eine geht heute ohne das andere nicht mehr.
  
  Mir reichen die Features von RDNA3 völlig aus. Und RDNA 4 scheint es den RTX Karten in Sachen Raytracing und Upscaling ja gleich zu tun.
  
  Zitieren
  
  Von gerX7a BIOS-Overclocker(in)
  
  Zitat von theGucky
  
  Zudem frage ich mich, ob FSR4 ein einfacher DLL-Swap mit FSR3 sein wird oder nicht.
  
  Für eine Kompatibilität mit FSR4 setzt es eine Implementation von FSR 3.1 voraus, da erst hierbei das API mit Blick auf die bevorstehende Version 4.0 überarbeitet wurde. In etlichen Titeln werden Entwickler also anzupassen haben um von einer 3.0-Implementation auf eine 3.1-Implementation zu wechseln. Bei deutlich älteren 2.x-Titeln darf man annehmen, dass da kaum noch ein Entwickler/Publisher Geld für aufwenden wird.
  
  Zitat von theGucky
  
  Erst ab 90FPS empfinde ich Animationen und das Drehen der Kamera als flüssig.
  
  Ist faktisch ein sehr subjektives Thema, das vom konkreten Anwender abhängt. Es gibt durchaus nicht wenige Leute, die auch bspw. mit 60 Fps einen mehr als ausreichend flüssigen Bildeindruck haben. Manch' andere dagegen werden erst ab 120 Hz glücklich, aber selbstredend auch zulasten eines höheren Rechenaufwandes. Wenn man es jedoch nicht braucht, gibt es auch keinen Grund diese Ressourcen sinnlos zu verpulvern und kann stattdessen, wenn man die Rechenkapazitäten hat, diese eher in höheren Qualitätseinstellungen investieren.
  
  Abseits dessen, die "Definition" a la "eine UHD-Karte ist erst dann eine wenn 4K und das auch noch min. mit 120 Hz im Rasterizing" ist selbstredend völliger blödsinn.
  
  Zitat von Gurdi
  
  Viel interessanter sind die Änderungen am Cache und der Bildausgabe. Da freu ich mich schon drauf.
  
  Diese Aussage ist eher weniger sinnvoll, die von GreenBlue19 mit seinem Interesse an der "Enhanced memory compression" dagegen schon eher. Das liegt schlicht daran, weil sich die Verbesserungen am Cache (was soll deine "Bildausgabe" eigentlich in diesem Kontext bedeuten?) unmittelbar in den erzeilten Fps ausdrücken und hierzu hat man schon relativ konkrete Zahlen, sprich ob der Cache nun hin zu SuperDuper-MegaClass hin optimiert wurde ändert nun nichts nachträglich an der resultierenden Leistung. Dagegen bei der Speichernutzung ist es bisher noch völlig unklar, ob hier AMD tatsächlich was merklich verbessern konnte.
  
  Zitat von Thomas5010
  
  AMD wirbt mit einer besseren KI Leistung. Für lokale KIs ist VRAM Pflicht. 16GB sind nicht viel. Hiermit sind nur rudimentäre Modelle lauffähig.
  
  Was soll man sagen. Ist halt normales Marketing-BlaBla. Der Durchsatz ist faktisch zweifellos gestiegen und die Speichermenge bewegt sich auf einem Consumer-üblichen Niveau. Wer deutlich mehr Bedarf hat muss halt zur Konkurrenz greifen oder eher bei den professionellen Produkten und nicht bei den Daddle-Karten zugreifen.
  
  Unterm Strich aber eine hochinteressante Architekturüberarbeitung. Nur schade, dass sie es mit dem HighEnd-Design versägt haben. Hätten sie ihre MCM-Bemühungen gleich zu Beginn an aufgekündigt für diese Gen und nur noch einen zusätzlichen, geringfügig größeren Chip mit bspw. 5120 Shadern rausgebracht, hätten die selbst im HighEnd ein konkurrenzfähiges, immer noch monolitisches (günstiges, weniger komplexes, leichter zu fertigendes) Produkt anbieten können, das zweifellos gekauft worden wäre.
  
  Zitat von Silvio64
  
  Hier gibt es tin Video in dem die neuen AMD Karten Preislich mit Nvidia verglichen werden. Sofern man nur die Rasterleistung hernimmt, würde ich zustimmen, aber erstmal den Test abwarten.
  
  Welche überraschende und vor allem neue Erkenntnis entnimmst du diesem Video? Wenn du dem Marktführer hinterherrennen musst, bleibt dir nichts anderes übrig als über den Preis zu fahren um deine Produkte in eine attraktive Region schieben zu können. AMDs Produkte müssen zwangsweise mit einem guten bis gar besseren P/L-Verhältnis aufwarten. Bei RDNA4 darf man erneut gespannt sein, wie der Markt das aufnehmen wird. Bei den älteren Gens verhielt es sich auch schon so, bis auf den Pferdefuß Raytracing (was ja aber angeblich keinen interessierte) und die Karten wurden kaum gekauft. Man darf ihnen aber auf jeden Fall mehr Erfolg wünschen, denn einen in Teilen konkurrenzlosen Marktführer, dessen Hauptinteresse derzeit zudem in einem gänzlich anderen Industriezweig liegt, will man ebensowenig haben.
  
  Zitieren
  
  Von Thomas5010
  
  Zitat von Apfelkind
  
  Erstens hat er die 5090 ja explizit ausgeklammert, an die kommt nichts ran, ist eben so. Aber bis zu 5080 wäre mehr Speicher mit der Zeit tatsächlich sehr relevant. Dein 2. Satz ist zudem grob falsch: Schau dir mal die 3070 und die 6800 an, die bei Release ziemlich gleichauf waren, wobei die RTX in RT die Nase klar vorn hatte. Inzwischen hat sich das Blatt komplett gedreht und die 6800 kann noch heute sehr gut genutzt werden (dank 16GB VRAM), während der 3070 klar die Puste in immer mehr Games ausgeht, ihr läuft eben der 8GB Speicher voll.
  
  Wer damals eine VRAM starke Nvidia gekauft hat (2080ti) hat heute mehr Möglichkeiten als mit einer Radeon 5900XT. Letztere ist ja praktisch unbrauchbar geworden.
  
  Das beste Setting ist viel VRAM und Features. Das eine geht heute ohne das andere nicht mehr.
  
  Zitieren
  
  Direkt zum Diskussionsende