AMD Radeon RX 7000: Modell mit 16.384 FP32-Shadern?

6
News Andreas Link Als bevorzugte Quelle auf Google hinzufügen
AMD Radeon RX 7000: Modell mit 16.384 FP32-Shader? (1)
Quelle: AMD

Die Twitter-Gerückteküche erwähnt nun für die Radeon RX 7000 ein Gaming-Modell mit 16.384 FP32-Shader. Das könnte die Karte sein, die zuvor mit 15.360 FP32-Shader die Runde machte und die sich gegen Nvidias Enthusiasten-Karten stemmen soll.

Einer der beiden Twitter-Spekulanten für Grafikkarten, Greymon55, glaubt, dass AMD noch eine Navi-Karte mit 16.384 FP32-Shadern in der Pipeline hat. Dabei könnte es sich um das Modell handeln, das in anderen Gerüchten mit 15.360 FP32-Shadern genannt wird, aber auch explizit nicht Navi 31 sein, wo nur 12.288 FP32-Shader zum Einsatz kommen sollen. Damit ist die Verwirrung wohl perfekt.

Grundsätzlich ist man sich schon mal darüber einig, dass sich die Shader-Zahl pro Work-Group verdoppelt - von 128 auf 256. Man nimmt an, dass AMD hier architektonisch den Schritt geht, den Nvidia bereits bei Ampere ging. Und schon vor einiger Zeit machte als Maximalausbau einer Karte 16.384 Shader die Runde; da AMD aber ein MCM-Design wählt, wären das möglicherweise einfach zwei Chiplets von Navi 32 - den flexiblen Ansatz soll AMD wohl haben. Nach letztem Stand sind folgende GPUs geplant:

  • Navi "30": 16.384 SPs, 64 WGPs, 16 SAs, 8 SEs
  • Navi 31: 12.288 SPs, 48 WGPs, 12 SAs, 6 SEs
  • Navi 32: 8.192 SPs, 32 WGPs, 8 SAs, 4 SEs
  • Navi 33: 4.096 SPs, 16 WGPs, 4 SAs, 2 SEs

Wie die Karte aber im oben gezeigten Portfolio einzuordnen wäre, bleibt unklar. Es wäre das Gegenstück zu dem, was Nvidia im Enthusiasten-Bereich macht, mit einer RTX 4090 Ti oder Titan. Greymon erwähnt: "Wenn der Wettbewerb hart ist, kann sie jederzeit in eine Spielkarte umgewandelt werden." Das legt nahe, dass hier ein GPGPU-Design umgewandelt werden könnte. Es gibt zahlreiche Spekulationen darüber, was die Strategie ist. Die Performance-Prognose für die Radeons war um den Faktor 2,1 bis 2,2 für das Spitzenmodell Navi 31, bis es dann hieß, RDNA 3 sei "enttäuschend", ohne aber weiter auf Details einzugehen. Ob sich das auf die Raster-Performance bezog oder auf einen anderen Aspekt, bleibt bislang ungeklärt.

Quelle: Twitter

6
    • Kommentare (6)

      Zur Diskussion im Forum
      • Von Ghostshield Freizeitschrauber(in)
        Zitat von theGucky
        Doppelte Shader pro Workgroup heißt nicht doppelte Performance in Spielen, etc.......
        AMD macht es hier wie NVIDIA.
        Z.b. eine 6600XT hat 2048/128/64 Shader.
        Der Nachfolger hatte jetzt einfach 4096/228/64 Shader, hier wurden einfach die FP32 Einheiten verdoppelt.
        Aber die TMUs und ROPs sind unangetastet.

        Bei 16384 Shader, hätten wir 512 TMUs, ROPs Je nach dem wie sie es an den 256 Bit Interface anbinden, 128 oder 256 ROPs.

        Ich denke Mal das es am Ende so ist
        16384/512/128 bei 2,5 GHz haben wir dann:
        Pixel Rate:........320.0 GPixel/s
        Texture Rate:..1[Ins Forum, um diesen Inhalt zu sehen]
        FP16 (half) performance:...160.00 TFLOPS
        FP32 (float) performance:..8[Ins Forum, um diesen Inhalt zu sehen]
        Ausser die Effizienz der TMUs und ROPs steigert sich nochmal.
        Womit die theoretischen Leistungswerte näher an der Praxis sind.

        Eine ähnliche Änderung der Shader, wie Nvidia es mit der 3000er Serie getan hat, gab es damals bei ATI auch.
        X1800XT -> X1900XT
        Von 16/16/16 auf 48/16/16
        Das brachte zwischen 11-21% mehr Leistung
      • Von Ghostshield Freizeitschrauber(in)
        Zitat von theGucky
        Doppelte Shader pro Workgroup heißt nicht doppelte Performance in Spielen, etc.......
        AMD macht es hier wie NVIDIA.
        Z.b. eine 6600XT hat 2048/128/64 Shader.
        Der Nachfolger hatte jetzt einfach 4096/228/64 Shader, hier wurden einfach die FP32 Einheiten verdoppelt.
        Aber die TMUs und ROPs sind unangetastet.

        Bei 16384 Shader, hätten wir 512 TMUs, ROPs Je nach dem wie sie es an den 256 Bit Interface anbinden, 128 oder 256 ROPs.

        Ich denke Mal das es am Ende so ist
        16384/512/128 bei 2,5 GHz haben wir dann:
        Pixel Rate:........320.0 GPixel/s
        Texture Rate:..1[Ins Forum, um diesen Inhalt zu sehen]
        FP16 (half) performance:...160.00 TFLOPS
        FP32 (float) performance:..8[Ins Forum, um diesen Inhalt zu sehen]
        Ausser die Effizienz der TMUs und ROPs steigert sich nochmal.
        Womit die theoretischen Leistungswerte näher an der Praxis sind.

        Eine ähnliche Änderung der Shader, wie Nvidia es mit der 3000er Serie getan hat, gab es damals bei ATI auch.
        X1800XT -> X1900XT
        Von 16/16/16 auf 48/16/16
        Das brachte zwischen 11-21% mehr Leistung
      • Von theGucky Volt-Modder(in)
        Doppelte Shader pro Workgroup heißt nicht doppelte Performance in Spielen, etc..

        Von dem was ich gelesen habe spricht man ja von 2 GPUs mit je 400mm². Also 20% kleiner als eine RX 6900. Bei Ohne Verdoppelung wären das ~4100 Shader pro GPU. Was ebenfalls 20% weniger wäre als wie bei einer RX6900.
        Ohne Shaderverdoppelung hätte eine RX7900 also 60% mehr Shader als eine RX6900, mit 8200 Shader, aber mit 60% mehr Fläche also 800mm². Ist also ein Shaderzuwachs von 0% pro mm².

        Als Vergleich nun Nvidia mit der RTX2000 vs RTX3000.
        Die Größe wäre 754mm² zu 629mm². Und 4608 zu 5.376 Shader (ohne Verdoppelung).
        Nvidia hatte hier einen ~13% kleineren DIE, aber einen Shaderzuwachs von ~17%.

        Man sagt ja ein Dieshrink gibt entweder X Performance ODER X Effizienz. Und AMD könnte auf 0% Performacne und 100% Effizenz gehen. Die xxtra Performance kommt dann NUR durch die gesamt größere DIE-Fläche.
        Effektiv wäre das z.b. 60% mehr DIE für 60% mehr Performance bei gleichem Verbrauch der RX6900XT.
        Wohlgemerkt die Rechnung ist ohne die Verdoppelung der Shader, weil ich nicht weiß wie die sich auf die Performance auswirken ^^.
      • Von gerX7a BIOS-Overclocker(in)
        Die aktuellen Gerüchte, durchaus in unterschiedlichen Varianten, weisen eher daraufhin, dass zwei Compute- bzw. Shader-Tiles zum Einsatz kommen sollen. Hier wird man aber letzten Endes noch abwarten müssen und schlussendlich ist der interne Aufbau auch eher irrelevant sondern am Ende zählt eher wie viele Fps das eine oder andere Design schlussendlich auf den Monitor zaubern kann.
        Hier darf man sicherlich gespannt sein wie sich AMDs MCM-Ansatz gegen nVidia's monolithischen Ansatz mit Lovelace schlagen wird und welche Kompromisse welcher Hersteller an welcher Stelle eingegangen sein wird.
      • Von takan BIOS-Overclocker(in)
        Zitat von Incredible Alk
        Offiziell bestätigt ist nichts aber dass mindestens für das Highend-Modell MCM zum Einsatz kommt ist einer der sehr sicheren Gerüchteteile.

        Bemerke: MCM bedeutet NICHT zwingend "mehrere GPUs", auch eine GPU mit weiteren Speicher-Dies (InfinityCache) ist ein MCM.
        so wie ich es verstanden habe, sind die neuen karten schon mit nem mcm design und kommunizieren übern infinity fabric. jedoch ist es nur ein chiplet zuerst. so wie beim zen 2 8 kerner, ein chiplet + i/o die im package halt. nur mehrere chiplets gibts im profi bereich. im consumer bereich erst nachfolgende generation, soll ja idiotensicher sein und nen massenbenchmark-beta mit 0815 usern wäre too much.
      • Von Incredible Alk Flüssigstickstoff-Guru (m/w)
        Zitat von twack3r
        AMD wählt ein MCM Design?

        Ist das jetzt bestätigt?
        Offiziell bestätigt ist nichts aber dass mindestens für das Highend-Modell MCM zum Einsatz kommt ist einer der sehr sicheren Gerüchteteile.

        Bemerke: MCM bedeutet NICHT zwingend "mehrere GPUs", auch eine GPU mit weiteren Speicher-Dies (InfinityCache) ist ein MCM.
      Direkt zum Diskussionsende
  • Print / Abo
    Apps
    PCGH Magazin 07/2026 PC Games 06/2026 play5 07/2026 N-Zone 06/2026 Linux Magazin 06/2026 LinuxUser 06/2026 Raspberry Pi Geek 07/2026
    PC Games Hardware PC Games Linux Magazin Raspberry Pi Geek Computec Kiosk