Radeon RX 7000: Block-Diagramme zu Navi 31, 32 und 33 veröffentlicht

News 04.08.2021 um 13:56 Uhr Benjamin Gründken Als bevorzugte Quelle auf Google hinzufügen

Quelle: AMD

Ein Twitter-Nutzer hat Block-Diagramme für die kommenden Radeon-GPUs Navi 31, Navi 32 und Navi 33 veröffentlicht. Als Grundlage dienten ihm die schon länger durchs Netz schwirrenden (mutmaßlichen) Spezifikationen der Radeon-RX-7000-Serie, die sich teilweise aus Multi-Die-GPUs zusammensetzen soll.

Die mutmaßlichen Spezifikationen der nächsten Radeon-Generation gehen schon seit einigen Wochen durchs Netz. Twitter-Nutzer "Olrak29" hat auf Grundlage dieser Daten nun Block-Diagramme für Navi 31, Navi 32 und Navi 33 erstellt, die den Aufbau der einzelnen RDNA-3-Chips besser veranschaulichen. Wie man anhand der Grafiken ganz gut erkennen kann, setzen sich Navi 31 und Navi 32 aus zwei Compute-Dies zusammen. Derweil soll es sich bei Navi 33 um ein monolithisches Design handeln.

Die Spezifikationen, auf deren Basis "Olrak29" seine Block-Diagramme aufbaut, hatten zuvor schon mehrere Leaker in den Raum gestellt. Demnach bringt das kommende GPU-Flaggschiff (Navi 31) 15.360 Shader-Einheiten zum Zuge, verteilt auf zwei Compute-Dies mit jeweils 30, insgesamt also 60 Workgroup Processors (WGP). Ebenfalls zwei MCD-Chiplets soll Navi 32 bieten, jedoch nur mit jeweils 20 WGPs. Mit insgesamt 40 WGPs würde ein solcher Grafikprozessor noch auf 10.240 Shader- beziehungsweise FP32-Einheiten kommen. 20 WGPs und damit noch 5.120 Shader-Einheiten werden Navi 33 nachgesagt.

Empfohlener redaktioneller Inhalt [EMBED_URL] An dieser Stelle finden Sie externe Inhalte von [PLATTFORM]. Zum Schutz Ihrer persönlichen Daten werden externe Einbindungen erst angezeigt, wenn Sie dies durch Klick auf "Alle externen Inhalte laden" bestätigen: Ich bin damit einverstanden, dass mir externe Inhalte angezeigt werden. Damit werden personenbezogene Daten an Drittplattformen übermittelt. Mehr dazu in unserer Datenschutzerklärung.

Externe Inhalte Mehr dazu in unserer Datenschutzerklärung.

Radeon RX 7000 mit RDNA 3: Launch erst im Oktober 2022?

Während man Navi 31 ein 256 Bit breites Speicherinterface und 256 bis 512 MiByte Infinity Cache nachsagt, war bei Navi 32 von 192 Bit und 256 bis 385 MiByte die Rede. Obwohl Navi 33 mit 5.120 so viele Shader-Einheiten wie das aktuelle Navi-21-Flaggschiff in Form der Radeon RX 6900 XT bieten soll, erwartet die Gerüchteküche eine 128-Bit-Anbindung und 128 bis 256 MiByte Infinity Cache. Bei der Radeon RX 6900 XT stehen noch 256 Bit und ein 128 MiByte großer IC auf der Habenseite.

Mehr zum Thema: AMD Navi 31, 32 und 33: Nicht nur das Flaggschiff mit deutlich mehr Shader-Einheiten?

Unklarheit herrscht immer noch darüber, wann AMD seine RDNA-3-Grafikkarten veröffentlicht. Leaks nach könnten erste GPUs im Oktober 2022 erscheinen - was aber nicht zwangsläufig heißt, dass alle drei zeitgleich auf den Markt kommen. Vermutlich veröffentlicht AMD auch die Radeon-RX-7000-Reihe wieder gestaffelt.

Quelle: Twitter (1, 2, 3)

Externe Inhalte Mehr dazu in unserer Datenschutzerklärung.

Artikel teilen

Radeon RX 7000: Block-Diagramme zu Navi 31, 32 und 33 veröffentlicht Ein Twitter-Nutzer hat Block-Diagramme für die kommenden Radeon-GPUs Navi 31, Navi 32 und Navi 33 veröffentlicht. Als Grundlage dienten ihm die schon länger durchs Netz schwirrenden (mutmaßlichen) Spezifikationen der Radeon-RX-7000-Serie, die sich teilweise aus Multi-Die-GPUs zusammensetzen soll.

Per E-Mail versenden

- Kommentare (66)
  Zur Diskussion im Forum
  
  Von Technologie_Texter BIOS-Overclocker(in)
  
  Zitat
  
  Also MUSS es kleinere Chips geben, die man eher in Einstiegskarten verbaut, d.h. Einstiegskarten werden keine 5000 ALUs haben.
  
  Wer sagt denn, daß man dafür nicht erstmal bei einer kleinen RDNA2-GPU bleibt?
  
  Zitat
  
  Ich sage das nicht, die Gerüchteküche.
  
  Ob der Cache gestapelt wird geht aus dem Gerücht nicht hervor.
  
  Zitat
  
  Aber denke Latenzen beim Zugriff mehrerer Module stehen dem im Weg (muss schließlich koordiniert werden), daher wären es dann eher jeweils 256 MB je Recheneinheit, was keinesfalls 100% 512 MB entspricht (da Daten doppelt vorhanden sein können).
  
  Damit liegst du falsch!
  
  Zitieren
  
  Von Technologie_Texter BIOS-Overclocker(in)
  
  Zitat
  
  Also MUSS es kleinere Chips geben, die man eher in Einstiegskarten verbaut, d.h. Einstiegskarten werden keine 5000 ALUs haben.
  
  Wer sagt denn, daß man dafür nicht erstmal bei einer kleinen RDNA2-GPU bleibt?
  
  Zitat
  
  Ich sage das nicht, die Gerüchteküche.
  
  Ob der Cache gestapelt wird geht aus dem Gerücht nicht hervor.
  
  Zitat
  
  Aber denke Latenzen beim Zugriff mehrerer Module stehen dem im Weg (muss schließlich koordiniert werden), daher wären es dann eher jeweils 256 MB je Recheneinheit, was keinesfalls 100% 512 MB entspricht (da Daten doppelt vorhanden sein können).
  
  Damit liegst du falsch!
  
  Zitieren
  
  Von Honkalonka78 PC-Selbstbauer(in)
  
  Zitat von Technologie_Texter
  
  Was passt dir bei den ALUs denn nicht?
  
  Die Produktion davon sagt mir, dass es die so nur zu hohen Preisen geben wird und der Stromverbrauch muss ja auch noch im Zaum gehalten werden.
  
  Mit Multichip ist das zwar entschärft, aber dennoch sind das (auf heutige Werte bezogen) High-End-Chips die 5000 und mehr ALUs haben sollen. Wie gesagt, dass erhöht den Ausschuss und damit erhöht es die Kosten.
  
  Also MUSS es kleinere Chips geben, die man eher in Einstiegskarten verbaut, d.h. Einstiegskarten werden keine 5000 ALUs haben.
  
  Zitat von Technologie_Texter
  
  Wer sagt denn, daß es eine Cache-Die mit 512MB geben muß?
  
  Ich sage das nicht, die Gerüchteküche. Ich halte das für überzogen, aber da es ein extra Modul sein wird (momentan redet man nur von 1 nicht von mehreren), kann es schon möglich sein. Die Frage ist auch hier wieder zu welchem Preis und warum sollte AMD das machen (außer um nvidia in die Schranken zu weisen).
  
  Zitat von Technologie_Texter
  
  Die Cache-Die könnte auch nur 256MB groß sein und bei den wenigen Top-Karten stapelt man da 2 Dice.
  
  Das stimmt, nur beim stapeln sind wir da glaube ich noch nicht. Wenn 2 einzelne Caches wie einer angesprochen werden können (also von allen Einheiten) dann macht das Sinn. Aber denke Latenzen beim Zugriff mehrerer Module stehen dem im Weg (muss schließlich koordiniert werden), daher wären es dann eher jeweils 256 MB je Recheneinheit, was keinesfalls 100% 512 MB entspricht (da Daten doppelt vorhanden sein können).
  
  In der absoluten High-End-GPU könnte ich mir das vorstellen, aber das wird kosten.
  
  Ich freue mich jedenfalls auf die neuen Einstiegskarten. Sollte es eine 7600 oder 7600 XT mit den Daten geben, dann wäre ich mehr als happy, das wären ~100% mehr Leistung zu jetzigen GPUs.
  
  Bei den aktuellen Preisen reizen mich die 6xxx leider nicht. Eine kommende RX 6600 XT hat mir mit 32 MB zu wenig IC (nutze WQHD). Daher ist meine obige Annahme von 96-128 MB IC für ne 7600 schon sehr optimistisch, realistisch werden es wohl eher 64 - 96 sein.
  
  Zitieren
  
  Von Technologie_Texter BIOS-Overclocker(in)
  
  Was passt dir bei den ALUs denn nicht?
  
  Wer sagt denn, daß es eine Cache-Die mit 512MB geben muß?
  
  Die Cache-Die könnte auch nur 256MB groß sein und bei den wenigen Top-Karten stapelt man da 2 Dice.
  
  Zitieren
  
  Von Honkalonka78 PC-Selbstbauer(in)
  
  AMD hat auch nichts zu verschenken, die ALU-Werte sind mir etwas zu utopisch im Vergleich zu heute.
  
  5120 ALUs, 160-192 MB IC für eine 7700 XT (Vollausbau)
  4608 ALUs, 128-160 MB IC für eine 7700 (Teilverwertung)
  3840 ALUs, 128 MB IC für eine 7600 XT (Vollausbau)
  3200 ALUs (eher 2560), 96-128 MB IC für eine 7600 (Teilverwertung)
  
  Damit wäre man im Einstiegs- und Midrange-Bereich locker bei 80% - 100% über heutiger Leistung.
  
  Selbst bei 6nm muss AMD auf die Kosten achten und die Chipgrößen im Zaum halten.
  
  Der Infinity Cache könnte als gesonderter Chip natürlich anwachsen.
  Aber auch hier, warum soll AMD 512 MB "verschenken", wenn 256 MB für das Topmodell auch schon eine Verdopplung wären? Max sind vielleicht 384 MB drin.
  Wenns dazu eh schon schnelleren RAM gibt, dann wäre das Verschwendung.
  
  Die Top-Modell könnten natürlich so stark anwachsen, dank Multi-Chip. Aber ganz ehrlich, die werden 1500 Euro + kosten und das wäre der Preis in normalen Zeiten, aktuell würde die Karte für 3500 - 4000 über den Tisch gehen.
  
  Aber auch die Multichips müssen produziert werden und ich will nicht wissen wie hoch der Ausschuss ist bei 5120 ALUs auf einem Chip, geschweige denn wenn noch mehr ALUs drauf sein sollen.
  
  2023 ist schließlich auch noch ein Jahr und da will AMD bestimmt RX 8xxx verkaufen, das könnten die mit leicht höherem IC und ALU Vollausbau machen, ohne eine neue Archtiketur in den Markt zu werfen. + evtl. GDDR7 und fertig ist die Laube.
  
  Zitieren
  
  Von gerX7a BIOS-Overclocker(in)
  
  Ja, da gibts durchaus viele Designpfade, die man wählen könnte. Der limitierende Faktor wird am Ende immer die Wirtschaftlichkeit sein und nicht etwa das maximal größte Lächeln den Enthusiast-Gamern ins Gesicht zu zaubern, denn schließlich sind sowohl AMD wie auch nVidia hier zum Geldverdienen und nicht etwa als Weltverbesserer unterwegs. Beim erstgenannten Brand vergessen das leider so manchen immer gerne.
  
  Zwei, drei lose Anmerkungen:
  
  RDNA3 wird in den unteren Marktsegmenten sicherlich weiterhin monolithische Designs verwenden; MCM wäre da vermutlich zu teuer.
  
  CDNA (ein angepasstes GCN) ist komplett unabhängig von der RDNA-Entwicklung und rein auf Compute Workloads ausgelegt. In der Architektur wurden gar wesentliche Bestandteile an 3D-Funktionseinheiten wegrationalisiert. Im Wesentlichen ist noch die Media-Engine übriggeblieben, damit Video verarbeitet werden kann, weil viele AI-Workloads Videomaterial verarbeiten.
  
  Letzten Endes ist das schon alles recht interessant und technologisch haben die Hersteller hier sicherlich vielfältige Möglichkeiten, die weitaus effizientere oder leistungsfähigere Designs ermöglichen würden, nur der Generalanspruch und das Thema Wirtschaftlichkeit schränken den Griff in die Technologiekiste natürlich ein und wenn eine Firma am Ende des Bilanzjahres Umsatz und Gewinn X, Y unterm Strich stehen haben will und Produktsparte dazu z % beitragen muss, dann kann man halt nicht das technisch Beste verbauen. AMD hat sich mal irgendwann mit HBM versucht und das auf den Weg gebracht, jedoch beispielsweise Intel und nVidia dürften seit etwa 2016/17 schon durchgehend weitaus mehr HBM2 als AMD verbauen in ihren Produkten, was am Ende schlicht ein Resultat der Kosten ist, denn auf rein technischer Seite hat HBM etliche Vorteile für sich zu verzeichnen. Und mit der Architekturaufspaltung wird man zukünftig auch kein Abfallprodukt a la Radeon VII mehr erwarten können, sondern muss warten, bis nVidia oder AMD tatsächlich gezielt HBM in den Consumer-Markt bringen werden.
  Ich würde zumindest vermuten, sofern nicht etwas wie GDDR7 überraschend schnell kommt (oder Micron ihren OC-GDDR6 noch stark weiteroptimieren kann) oder aber man die Caches einfach noch und nochmals größer macht um weiterhin mit GDDR6 günstig wegkommen zu können, dass die übernächste GPU-Gen (2024?) zumindest im HighEnd mit HBM aufwarten wird.
  
  Btw ... Intel hat hier ja schon mit Sapphire Rapids SP skizziert was kommen wird. Eine Tile-basierte via EMIB-zusammengesetzte CPU, deren Tiles wahrscheinlich vollstädiges I/O besitzen werden, also grob vermutet 16 PCIe 5.0 Lanes pro Tile zzgl. zwei DDR5-Controllern und zusammengesetzt bis zu vier Tiles pro CPU.
  Zudem darf man vermuten, dass sofern es nicht einen separaten Tile geben wird, dass jeder Tile zusätzlich über einen HBM2-Controller/PHY verfügen wird, um einen HBM2-Stack anbinden zu können. Die volle CPU kann also 64 GiB (bestenfalls wäre gar 96 GiB möglich) HBM2 auf dem Package haben, die als L4$ fungieren können und das Speichersubsystem damit drastisch beschleunigen dürften, was vor allem für AI-Workloads vorgehen sein wird. Darüber hinaus erklärte man aber auch schon, dass ein DRAM-less Mode möglich sein soll, d. h. die CPU läuft ausschließlich mit dem HBM2 als LastLevel-Speicher ohne DRAM.
  Ein HEDT-Ableger davon mit bspw. nur zwei CPU-Tiles und 32 GiB HBM2 mit vielleicht 500+ GiB/s Speicherbandbreite klingt schon ein wengi verrückt.
  
  Und zukünftige Designs werden gar noch komplexer. Von Meteor Lake weiß man schon, dass es ein Compute-Tile gibt, jedoch auch dass das Design Foveros nutzen wird, d. h. es wird interessant, was uns hier in Zukunft erwartet, wobei man aber auch nüchtern sagen muss, dass das leistungstechnisch schon alles weit über den einfachen Consumer-Bedarf hinausgeht ... ja,ja, ich weiß, so mancher wird ja dennoch nicht müde zu behaupten "es gibt nie genug"
  
  Zitieren
  
  Direkt zum Diskussionsende

Hoch

Print / Abo

Apps

Die Redaktion Datenschutz Artikel-Archiv Datenschutz-Optionen Mediadaten Impressum Utiq verwalten Abo kündigen AGB Inhalt melden Newsletter

Radeon RX 7000 mit RDNA 3: Launch erst im Oktober 2022?

Artikel teilen

Kommentare (66)