AMD Radeon RX 8000 ("RDNA 4"): Navi 44 + Navi 44 = Navi 48?
Während Nvidia mit den Geforce RTX 5000 ("Gaming-Blackwell") in völlig neue Sphären vordringen will, wird AMD mit seinen Radeon RX 8000 ("RDNA 4") vorerst kleinere Brötchen backen müssen. Dennoch könnte so die erste "Chiplet-GPU" entstehen.
Während Nvidia mit den Geforce RTX 5000 ("Gaming-Blackwell") in völlig neue Sphären vordringen will, wird AMD mit seinen Radeon RX 8000 ("RDNA 4") vorerst wohl etwas kleinere Brötchen backen müssen. Dennoch könnte auf diesem Weg die erste echte "Chiplet-GPU" überhaupt entstehen. Während Radeon RX 7000 ("RDNA 3") bereits eine GPU sowie den Grafikspeicher und Infinity Cache über insgesamt zwei Dies als MCM ("Multi-Chiplet-Module") zusammensetzt, könnten jetzt erstmals überhaupt zwei Grafikprozessoren zu einer GPU zusammengefasst werden.
2 × Navi 44 = 1 × Navi 48 = Radeon RX 8800 XT
Wie der für gewöhnlich bestens informierte Insider HXL (@9550pro) über den Kurznachrichtendienst X - vormals Twitter - mitgeteilt hat, soll es sich bei Navi 48 um die erste echte MCM-GPU ("Multi-Chiplet-Module-GPU") überhaupt handeln, die den kleineren RDNA-4-Grafikprozessor Navi 44 in gleich doppelter Ausführung zu einem Grafikprozessor im Chiplet-Design kombiniert. Der ersten Hinweise sind vormals auf der chinesischen Foren-Plattform Tieba Baidu aufgetaucht.
Bereits Navi 31, dem größten Grafikprozessor auf Basis von RDNA 3, welcher letztlich auf der Radeon RX 7900 XTX, Radeon RX 7900 XT und Radeon RX 7900 GRE zum Einsatz kam, wurde in der Entwicklungsphase nachgesagt, dass er aus gleich mehreren GPUs bestehen soll. Diese Vermutung bewahrheitete sich aber schlussendlich nicht, wurde mit Instinct MI300 und MI200 realisiert.
Radeon RX 8800 XT unterhalb der Radeon RX 7900 XTX
Nach einem Post von @All_The_Watts im vergangenen Monat ordneten viele Websites, darunter Wccftech, die hieroglyphische Grafik hinsichtlich der Leistungsfähigkeit der beiden RDNA-4-Grafikprozessoren wie folgt ein.
Navi 48 vs. Navi 31
- Navi 31 XT ("Radeon RX 7900 XTX")
- Navi 48 XT ("Radeon RX 8800 XT")
- Navi 31 XL ("Radeon RX 7900 GRE")
- Navi 48 XL ("Radeon RX 8700 XT")
Navi 44 vs. Navi 32/33
- Navi 32 XT ("Radeon RX 7800 XT")
- Navi 44 XT ("Radeon RX 8600 XT")
- Navi 33 XT ("Radeon RX 7600 XT")
- Navi 44 XL ("Radeon RX 8600")
Bei der Raytracing-Performance sollen die direkten Vorgänger respektive die in dieser Preisklasse positionierten RDNA-3-Grafikkarten laut den jüngsten Gerüchten voraussichtlich um 25 bis 30 Prozent übertroffen werden.
Chiplet-GPU ergibt nicht für alle Sinn
Der ebenfalls für seine Vorabinformationen bekannte @Kepler_L2 hält dieses Gerücht seinerseits nicht für valide und antwortete dementsprechend vielsagend auf den Beitrag von @9550pro auf X.
Anders als beim Aufbau der größeren der beiden RDNA-4-Grafikprozessoren sind sich bei den technischen Spezifikationen mittlerweile die meisten Quellen und Beobachter einig, wohin die Reise von AMDs Radeon RX 8000 gehen wird.
Radeon RX 8800 XT, 8700 XT, 8600 XT und 8600
Neben den Spezifikationen der beiden RDNA-4-Grafikprozessoren, über die in der Gerüchteküche weitgehend Einigkeit herrscht, hat 'Graphics Card Prediction Orange' seinen Angaben nach Informationen zu den voraussichtlichen vier Modellen, die auf der Basis der beiden GPUs vorgestellt werden sollen. Demnach setzen die Radeon RX 8800 XT und die Radeon RX 8700 XT auf Navi 48, während die Radeon RX 8600 XT und Radeon RX 8600 auf Navi 44 basieren sollen. Hier die Mutmaßungen, die keinesfalls als gesetzt oder gar bestätigt angesehen werden sollten.
Quelle: Graphics Card Prediction Orange via Baidu Tieba
Die Spezifikationen der beiden RDNA-4-Grafikprozessoren decken sich mit den bisherigen Gerüchten, welche zudem aus den unterschiedlichsten Quellen bestätigt werden. Demnach sollen die beiden neuen Navi-4X-GPUs im Vollausbau mit den nachfolgenden technischen Spezifikationen aufwarten können.
Navi 48 ("GFX1201")
- 64 Compute Units ("CUs")
- 128 Raster Operating Processors ("ROPs")
- 4.096 Streaming Processors ("SMs")
- 64 MiByte AMD Infinity Cache
- 270 mm² Die-Size
- 275 Watt
Navi 44 ("GFX1200")
- 32 Compute Units ("CUs")
- 64 Raster Operating Processors ("ROPs")
- 2.048 Streaming Processors ("SMs")
- 32 MiByte AMD Infinity Cache
- 145 mm² Die-Size
- 150 Watt
Während wiederum andere Gerüchte davon sprechen, dass AMD im High-End-Bereich noch einmal ein kleines Aufbäumen mit einem "Navi 31 XT als Refresh" oberhalb der Radeon RX 8800 XT positionieren könnte, ist zuletzt durchgesickert, was mit dem mittlerweile verworfenen Navi 41 XT möglich gewesen wäre.
Ihre Meinung ist gefragt!
Wie stehen Sie zu diesem Thema? Die PCGH-Redaktion freut sich über Ihre fundierte Meinung in den Kommentaren zu dieser Meldung. Um zu kommentieren, müssen Sie auf PCGH.de oder im Extreme-Forum eingeloggt sein. Sollten Sie bisher noch keinen Account haben, könnten Sie sich hier unverbindlich registrieren. Beachten Sie beim Kommentieren aber bitte die geltenden Forenregeln.
Quelle: @9550pro, @Kepler_L2, @ 0x22h via Tieba Baidu

Durch meinen Job lese ich genau was da steht und spare mir jegliche Interpretation.
Dein von mir zitierter Beitrag erwähnt Gaming nicht im Zusammenhang mit CPUs. Da bist du nur bei Servern und sogar server GPUs im direkt davor stehenden Satz.
Dass du deine Aussage später aufs Gaming beziehst ist ja ok.
Du sagst ja auch viele korrekte Sachen - auch wenn du zu sehr davon ausgehst, dass die Chiplet Technologie nicht nutzbar ist, nur weil die aktuellen Game Engines nicht gut damit umgehen, Tasks zu verteilen.
Im Grunde ist das ein "Das haben wir schon immer so gemacht" Ansatz, der schlicht Änderungen ausschließt, nur weil aktuell Dinge nicht funktionieren.
1) Der Sprung auf mehr Kerne pro CCX ist schlicht der weiteren Miniaturisierung zu verdanken und dass man so deutlich mehr Kerne insgesamt auf eine MCU packen kann. Mit nur 4 Kernen pro CCX kommst du nur mit extremen Baugrößen auf 128 Kerne und mehr.
Für jede CCX kommen Mindestabstände für Interfaces dazu, was man mit doppelter Kernzahl pro CCX mal eben halbiert.
2) Wo hat AMD einen Rückzug von Chiplets in GPUs gemacht?
Für Gaming gab es noch keine Chiplet GPUs.
Für Server sind die MI200er die aktuellen, auf Chiplet basierenden GPUs.
[Ins Forum, um diesen Inhalt zu sehen]
Die CDNA Chiplets sehen dabei halt anders aus, als CPU CCX.
Bei CDNA3 ging AMD etwas weiter mit den Chiplet Design für die MI300* Beschleuniger:
[Ins Forum, um diesen Inhalt zu sehen]
Alles in allem ist eher das Gegenteil der Fall. AMD (und Nvidia) lernt von den ersten GPU Chiplet Erfahrungen und wird die in Zukunft so weit wie möglich ausrollen.
Das dürfte auch der Grund sein, weshalb nach RDNA4 eine neue Architektur kommt.
Die wird sich in einigen Bereichen kräftig bei CDNA bedienen, um Chiplets umsetzbar zu machen.
AMD ist das mit Zen 3 angegangen und war danach deutlich konkurrenzfähiger, indem man eine Basis mit 8 Kernen pro CCX geschaffen hat die Anwendungen und Spiele ausreichend ohne den Umweg über den Fabric beschleunigt.
Intel geht sogar noch weiter und lässt alle P und E Cores in einem Tile und splittet das nicht auf.
Und genau da kommt dann die Technologie zum Einsatz.
Auch beim Gaming.
Du lässt irgendwie die Absicht erkennen nicht verstehen zu wollen. Schade.
Für den einfachen Anwender bringen Chiplets auch nichts..
Denn du nimmst einfach mal an, dass kein Chipletdesign nötig ist, weil die ganze Zeit über genug Kerne und Recheneinheiten auch in einem monolitischen Design ausreichend vorhanden sind.
Es geht ja aber auch um den Fall, wo das nicht mehr reicht.
Und genau da kommt dann die Technologie zum Einsatz.
Auch beim Gaming.
Die Fertigung kann nicht beliebig geshrinkt und Wafer nicht xbeliebig groß geschnitten und belichtet werden, irgendwo gibt es technologische und kostenintensive Grenzen.
Mit Zen 1 gab es maximal 4x4 Kerne, jetzt halt schon 8er Klötze.
Letzteres ist aber auch nur möglich dank der feineren und kleineren Strukturbreite
Da kann man ja quasi froh sein, dass die Softwarehersteller das genau dafür angepasst haben.
Doch schon kommt PCGH daher und empfehlt sogar größere Mehrkerner für Leute, die dann nebenher auch noch Streamen wollen, oder sonstigen Klimbims an haben.
Was wäre aber wenn das jetzt mal technologisch nicht funktioniert hätte, so wie Intel seit Jahren mit seiner 10nm und 7nm Geschichte rumhampelt udn nichts geschissen bekommt?
Wenn AMD also auch heute noch maximal 4 Einheiten so gemeinsam Platzieren könnte?
Würdest du sagen 4 Kerne reichen fürs anspruchsvolle Gaming?
Klar könnte man dann sagen: ja aber halt, das ist ja nur ein kleiner CCD, warum nicht stattdessen monolitisch auf 8 gehen?
Klar, geht, aber das topediert den Vorteil der CCD Entwicklung, weil man dann wieder komplett zweigleisig entwickeln und produizeren muss , die damit eigentlich kostengünstigere Produktion führt also zu einer Verteuerung des Ganzen und alle Chips werden teurer.
Das will aber auch wieder vor allem kein Spieler bezahlen.
Und wie gesagt nur monolitisch komtm man dann wieder an die Grenze für Anwender, die nicht in den Genuss vieler Kerne kommen können, dann wäre vielleicht wieder monolitisch bei 16 oder 32 Kerne Schluss, also nix da 96 Kerne oder gar 128.
Man kann es drehen wie man will: langfristig ist monolitisch nichts mehr zu reißen.
Lieber viele Kerne mit 80% Leistung beliebig ergänzen, statt wenige mit 100% zu haben.
Alle größeren GPUs im Serverbereich nutzen Chiplets.
Es gibt durchaus noch Bereiche außerhalb von KI, die GPUs nutzen.
Das Tolle an GPUs ist halt, dass sie mehr als ein One Trick Pony sind.
Und gleich drauf zu schreiben, dass sich Chiplets im CPU Bereich nicht durchgesetzt haben, schließt dann halt alle CPUs mit ein - inklusive dem Server Bereich. Immerhin schreibst du das direkt im Zusammenhang.
Und ob du eine 5900er, oder 7900er CPU oder eine 14900K CPU für Gaming nutzt, oder nicht... es sind Desktop Chips, die durchaus für Gaming fähig sind.
Die Chiplet Technologie wird bleiben. Gaming ist eh nur das kleine Anhängsel, dass CPU Entwicklungen mit nutzt.
Allerdings sind die Gaming Engines (und Windows) noch bei weitem nicht in der Lage, mehr als eine CCD sinnvoll zu nutzen.
Vor allem da die Gaming KIs ja vergleichsweise einfach gestrickt sind, könnte man deren Berechnung schön auf eine zweite CCD auslagern und vieles in einer open world darauf berechnen lassen, während die nähere Umgebung auf dem Main CCD berechnet wird.
Das ist aber auch nicht gerade leicht umzusetzen und erfordert ziemlich andere Ansätze im Grunddesign.
So weit ist die Industrie aktuell schlicht nicht.