Radeon RX 9070 XT und 9070: AMD erklärt die Leistungssprünge in Raster und Raytracing
Im Rahmen des "Architecture Deep Dive" erläutert AMD seine neue Mikroarchitektur RDNA 4 sowie die darauf basierenden Grafikprozessoren Navi 4X und deren Featureset im Detail und erklärt, wie die in Aussicht gestellten Leistungssprünge bei der Raster- und Raytracing-Leistung realisiert werden.
RDNA 4 im Detail
Im Rahmen des "Architecture Deep Dive" erläutert AMD in Person von Andrew Pomianowski, Senior Vice President für Silicon Design Engineering ("SVP"), seine neue GPU-Mikroarchitektur RDNA 4 ("GFX12") sowie die darauf basierenden Grafikprozessoren Navi 48 XTX ("GFX1201") und Navi 48 XT ("GFX1201") und deren Featureset im Detail und erklärt, wie die in Aussicht gestellten Leistungssprünge bei der Raster- und Raytracing-Leistung realisiert werden konnten. Später soll dann zwei weitere Ableger mit Navi 44 ("GFX1200") folgen.
Performance per Compute Unit
RDNA 4 soll bei der Leistung pro Recheneinheit, der Performance per Compute Unit, gegenüber RDNA 3 sowohl bei der Rasterleistung als auch der Raytracing-Performance und ML-Leistung deutlich zugelegt haben. Die Vision für die Architektur sah dabei wie folgt aus.
- Weitreichend optimiert für anspruchsvolle Gaming-Workloads
- Stark verbesserte Rasterleistung und Recheneffizienz
- Ein deutlicher Leistungssprung in der Raytracing-Performance
- Umfassende Hochleistungsunterstützung für Maschinelles Lernen
- Verbesserte Bandbreiteneffizienz für sämtliche Workloads
- Multimedia-Verbesserungen für Spiele und Creator
Die selbst gesteckten Ziele möchte AMD mit der RDNA-4-Architektur erfolgreich abgehakt haben, wie der Vergleich der relativen Leistungsfähigkeit von RDNA 2, RDNA 3 und RDNA 4 im Hinblick auf die eingangs erwähnte Performance per Compute Unit verdeutlichen soll.
Quelle: AMD
AMD sieht seine "RDNA 4 Vision" im Hinblick auf Rasterleistung, Raytracing-Performance und KI-/ML-Leistungsfähigkeit als erfüllt an, doch welche architektonischen Änderungen waren hierfür notwendig? Die Umbauarbeiten fielen durchaus umfangreich aus, wie AMD im Architecture Deep Dive erläutert und anhand eines GPU-Diagramms verdeutlicht.
- Im Fokus der Radeon Technologies Group ("RTG"), der Technikabteilung rund um RDNA 4 und die Radeon RX 9070 Series, lagen die Compute Units, die AMD gegenüber RDNA 3 massiv umgebaut wurden, um deren Leistung zu erhöhen.
- AMD attestiert RDNA 4 in etwa 40 Prozent mehr Rasterleistung, wobei diese sich zu gleichen Teilen aus einer höheren Taktfrequenz und einer höheren Leistung pro Taktzyklus, der sogenannten IPC ("Instructions per Cycle") zusammensetzt.
- Die Raytracing-Performance soll dabei um etwa 70 Prozent ansteigen, während der Leistungszuwachs im Hinblick auf KI und ML sogar 100 Prozent betragen soll.
Doch mit welchen Änderungen an Navi 4X ("GFX12") im Vergleich zu Navi 3X ("GFX11") möchte AMD diese Leistungssprünge letztlich erzielt haben?
Umfangreiche Umbauarbeiten
Am Beispiel des Navi 48 XTX der Radeon RX 9070 XT demonstriert AMD die umfangreichen Umbauarbeiten, die das Unternehmen aus Santa Clara vorgenommen hat. Der 356,5 mm² große Grafikprozessor verfügt über 53,9 Milliarden Transistoren und damit über eine vergleichsweise hohe Transistordichte von 151 Millionen Schaltungen pro mm².
Neben schnelleren FP32-ALUs, die über deutlich höhere Taktfrequenzen und mehr Leistung pro Taktzyklus ("IPC") verfügen, halten die folgenden Neuerungen Einzug:
- Echtzeit-Raytracing der 3. Generation
- Matrix-Beschleuniger der 3. Generation
- KI-Beschleuniger der 2. Generation
- Ein optimiertes Cache-System
Die beiden weitreichendsten, wenn auch bei Weitem nicht einzigen Änderungen an den Compute Units ("CUs") finden sich beim Raytracing und der KI-Beschleunigung respektive dem ML-Support wieder.
Während RDNA 4 im Vergleich zu RDNA 3 und RDNA 3.5 bei der KI-Beschleunigung binärer Fließkommazahlen mit einer halben Genauigkeit ("FP16") sowie binärer Ganzzahlen mit einer Genauigkeit von 63-Bit ("INT8") um den Faktor 2x respektive den Faktor 4x zulegt, wird unter Verwendung des Features "Sparsity", welches auf dünnbesetzte Matrizen, die sogenannten "Sparse Matrices", zurückgreifen kann, sogar die bis zu achtfache Rechenleistung für die Beschleunigung von Künstlicher Intelligenz bereitgestellt. Von diesem Leistungsplus im Hinblick auf die KI-Beschleunigung profitiert dank FSR 4 dann letztlich auch Spieler.
Quelle: AMD
Was die Raytracing-Beschleunigung angeht, bleibt der Hersteller aber bei seinem bislang genutzten Konzept und ändert den Aufbau dahingehend nicht. So gibt es nach wie vor keine separaten Raytracing-Beschleuniger, auch RDNA 4 nutzt Hardware in den Textureinheiten, um Raytracing-Lasten entsprechend zu beschleunigen. Deshalb spricht AMD auch gar nicht erst von Raytracing-Beschleunigern der 3. Generation, sondern nur von "3rd Gen Raytracing".
Quelle: AMD
Im Vergleich zu den Navi-3X-GPUs verfügen die Navi-4X-GPUs allerdings über eine doppelt so hohe Intersection Rate. Damit ist es jetzt möglich, doppelt so schnell zu prüfen, ob einer der geschickten Strahlen auf etwas trifft. Auch das Ray Taversal arbeitet durch BVH8, welches BVH4 ablöst, doppelt so schnell, sodass Strahlen pro Taktzyklus nun doppelt so tief in die BVH-Struktur eindringen können, als das noch bei RDNA 3 der Fall war. Unter dem Strich verspricht der Hersteller, dadurch 70 Prozent mehr Raytracing-Performance zu liefern.
Quelle: AMD (Screenshot: PCGH)
Quelle: AMD (Screenshot: PCGH)
Quelle: AMD (Screenshot: PCGH)
Quelle: AMD (Screenshot: PCGH)
Allein bis zu 10 Prozent mehr Raytracing-Performance sollen sich durch die sogenannten Oriented Bounding Boxes erzielen lassen, welche es ermöglichen, die BVH-Struktur an schräg im Raum platzierte Objekte anzupassen. Durch den Out of Order Memory soll sich zudem die Speicherlatenz reduzieren und die Renderpipeline effektiver auslasten lassen. Gleiches gilt ebenso für die KI-Beschleunigung, die sowohl Spieler als auch Creator adressieren soll.
Dank der stark erweiterten Unterstützung für das Maschinelle Lernen ("ML"), welches auf RDNA 4 um bis zu 100 Prozent schneller beschleunigt wird als noch auf RDNA 3, wird auch erst der potenzielle Game Changer, die KI-gestützte Upscaling-Technologie, möglich.
FSR 4 als der Game Changer
AMDs neueste Upscaling-Technologie FSR 4 soll dank der Unterstützung von Künstlicher Intelligenz ("KI") und Maschinellem Lernen ("ML") einen großen Schritt nach vorn machen und damit auch endlich deutlich konkurrenzfähiger zum aktuellen Klassenprimus DLSS von Nvidia werden. AMD verspricht für die Kombination aus dem neuen FidelityFX Super Resolution 4 und Frame Generation eine nochmals deutlich bessere Bildqualität bei gleichzeitig eine niedrigere Latenz. Trainiert wird der FSR-4-Algorithmus dafür auf AMD Instinct-GPUs.
Quelle: AMD
Mehr Leistung, niedrigere Latenzen und vor allem eine durch Künstliche Intelligenz und Maschinelles Lernen signifikant bessere Bildqualität sind AMDs erklärte Ziele für FSR 4. In Kombination mit Frame Generation sollen sich die Frameraten in 4K/UHD ("2160p") im Performance-Mode um das bis zu 3,7-fache steigern lassen. Doch auch ganz ohne Zwischenbildberechnung soll FSR 4 einen großen Leistungssprung erzielen.
Quelle: AMD
Zudem geht AMD das Thema Pathtracing mit Neural Supersampling und einem Denoiser an, was in Zukunft auf eine eigene Lösung als Gegenspieler zu DLSS Ray Reconstruction hindeutet. Hierzu hat der Hersteller allerdings noch keine Details genannt.
Neue Videoeinheiten
Speziell für RDNA 4 sowie die darauf basierenden Navi-4X-Grafikprozessoren hat AMD auch die Videoeinheiten, die sogenannten Media Engines, überarbeitet. Streams sollen mit HEVC- und AV1-Codec durch die neuen Dual-Encoder-Einheiten qualitativ besser werden, während der H.264-Codec jetzt bei geringen Bitraten deutlich besser aussehen soll als noch auf den Navi-3X-Grafikprozessoren. AMD verspricht eine bis zu 25 Prozent höhere Bildqualität.
Quelle: AMD
Weitere Informationen zur Radeon RX 9070 XT und Radeon RX 9070, welche am 6. März in den Handel kommen werden, liefert unser ausführliches Video zur Vorstellung der beiden insbesondere an Spieler adressierten RDNA-4-Grafikkarten.
Ihre Meinung ist bitte!
Wie stehen Sie zu diesem Thema? Die PCGH-Redaktion freut sich über Ihre fundierte Meinung in den Kommentaren zu dieser Meldung. Um zu kommentieren, müssen Sie auf PCGH.de oder im Extreme-Forum eingeloggt sein. Sollten Sie bisher noch keinen Account haben, könnten Sie sich hier unverbindlich registrieren. Beachten Sie beim Kommentieren aber bitte die geltenden Forenregeln.
Quelle: AMD

AMD wirbt mit einer besseren KI Leistung. Für lokale KIs ist VRAM Pflicht. 16GB sind nicht viel. Hiermit sind nur rudimentäre Modelle lauffähig.
Auch bei Videobearbeitung ist weniger VRAM ein Problem.
Also, wenn der Grafikkartenbesitzer in Zukunft auf die Idee kommt seine Grafikkarte anderweitig zu benutzen, dann sind die Limits brutal da.
Wenn ich von mir ausgehe, plane ich ja den GPU-Kauf entsprechend und überlege mir, ob ich die GPU z.B. 1 Jahr später für was anderes nutzen möchte und treffe dahingehend meine Kaufentscheidung.
Aber wenn ich dann doch was anderes mit der GPU machen möchte, was nicht in meine vorherigen Überlegungen einfloss, kann ich die GPU ja austauschen.
Abseits dessen, die "Definition" a la "eine UHD-Karte ist erst dann eine wenn 4K und das auch noch min. mit 120 Hz im Rasterizing" ist selbstredend völliger blödsinn.
Unterm Strich aber eine hochinteressante Architekturüberarbeitung. Nur schade, dass sie es mit dem HighEnd-Design versägt haben. Hätten sie ihre MCM-Bemühungen gleich zu Beginn an aufgekündigt für diese Gen und nur noch einen zusätzlichen, geringfügig größeren Chip mit bspw. 5120 Shadern rausgebracht, hätten die selbst im HighEnd ein konkurrenzfähiges, immer noch monolitisches (günstiges, weniger komplexes, leichter zu fertigendes) Produkt anbieten können, das zweifellos gekauft worden wäre.
Das beste Setting ist viel VRAM und Features. Das eine geht heute ohne das andere nicht mehr.