Grafikkarten im Chiplet-Design: Patent von AMD aufgetaucht

41
News Benjamin Gründken Als bevorzugte Quelle auf Google hinzufügen
Grafikkarten im Chiplet-Design: Patent von AMD aufgetaucht (1)
Quelle: freepatentsonline

Einem Patent nach plant AMD, einen schon durch Ryzen-3000- und 5000-Prozessoren bekannten Chiplet-Aufbau für Grafikkarten zu verwenden. AMD betont die Komplexität des Unterfanges, glaubt aber auch, dass die unterschiedlichen Einheiten mittels High Bandwidth Crosslinks effizient miteinander kommunizieren.

Gerüchte machen schon länger die Runde, nun ist ein einschlägiges Patent beim "United States Patent and Trademark Office" aufgetaucht. AMD beschreibt dort einen modular aufgebauten Grafikprozessor, ähnlich dem Chiplet-Design aktueller Ryzen-Prozessoren. Eine solche GPU würde sich aus mehreren Chiplets zusammensetzen, jeweils mit eigenen Compute Units und Cache. Allerdings übernimmt nur das "Primary Chiplet" die Kommunikation mit dem Hauptprozessor.

High Bandwidth Crosslinks für optimale Parallelisierung

Laut AMD sei ein modulares Design bei GPUs ebenso aufwendig wie kostspielig. Außerdem arbeite es wenig effizient, weil sich Last und Speicherinhalte nicht gut parallelisieren lassen. Zumindest nach derzeitigem Stand der Technik. Richten sollen es Treiberoptimierungen und das "Primary Chiplet", vor allem aber sogenannte High Bandwidth Crosslinks. Dahinter steckt eine passive Schnittstelle, die alle L3-Caches miteinander verbindet. Jedes Chiplet soll dadurch auf den Cache und die VRAM-Anbindung der anderen zugreifen können.

Ebenfalls interessant: Intel-CPUs: Exzessive Nutzung von Chiplets geplant, Start mit 7-nm-Fertigung

Offen bleibt, ob diese Bauweise auch bei Gaming-Grafikkarten Einzug hält oder (zunächst) nur bei profesionellen Lösungen, etwa einem CDNA-Nachfolger, wie zuletzt gemunkelt wurde. Außerhalb des Patents haben sich die Amerikaner jedenfalls noch nicht zu einer Chiplet-GPU geäußert. Falls es entsprechende Gaming-Grafikkarten geben sollte, was alles andere als gesetzt ist, könnte das frühestens bei RDNA 3 der Fall sein. Diese Architektur erscheint aktuellen Roadmaps nach im Jahr 2022.

Quelle: freepatentsonline

Empfohlener redaktioneller Inhalt [EMBED_URL] An dieser Stelle finden Sie externe Inhalte von [PLATTFORM]. Zum Schutz Ihrer persönlichen Daten werden externe Einbindungen erst angezeigt, wenn Sie dies durch Klick auf "Alle externen Inhalte laden" bestätigen: Ich bin damit einverstanden, dass mir externe Inhalte angezeigt werden. Damit werden personenbezogene Daten an Drittplattformen übermittelt. Mehr dazu in unserer Datenschutzerklärung.
Externe Inhalte Mehr dazu in unserer Datenschutzerklärung.
41
    • Kommentare (41)

      Zur Diskussion im Forum
      • Von Schinken BIOS-Overclocker(in)
        Zitat von 4thVariety
        Würden diese Spiele fundamental besser, wenn man eine 300TDP CPU hätte, die linear zur 100W CPU skaliert? Ich glaube nein. Auch diese Art von Spiel wird in die nächste Generation gehen, aber wir werden sehen, dass CPU Leistung weniger wichtig ist, weil die Aspekte der Weltsimulation über DeepLearning oder MachineLearning abgebildet werden und nicht mehr Brute-Force CPU. Das wird die CPU so wie wir sie kennen nicht ausrechnen, das wird dann die GPU machen, oder eine Hybrid CPU.

        Middleware im Jahr 2020 bedeutet, dass man Unreal Engine mit allen erdenklichen Plugins und Texturpaketen lizenziert. Middleware der Zukunft ist, dass man z.B. eine Version der Alpha Engine von Google lizenziert, die all die Dinge übernimmt, die jetzt eine CPU mit 100W auffressen. Google, Nvidia, Microsoft, Facebook, die würden da gerne alle die Player sein, die so eine Middleware vertreibt. Ki, World State Simulation, Bildschirmphysik, sind alles Aufgaben die in Zukunft von der CPU nicht mehr gemacht werden. Tensor Cores, KI Cores, nennt es wie ihr wollt, spezialisierte Kerne die man mit auf die GPU oder das Chiplet packt und mit CPU sehr wenig zu tun haben.
        Ähm, ja würden sie . Jede Partie endet nämlich weit bevor ich aufhören würde, weil der 3600 nur noch 1-2 FPS liefert.

        Es ist ja schön, wenn du glaubst bei zukünftigen Spielen wird das anders sein. Aber erstens glaubst nur du das und zweitens spiele ich jetzt und beende jetzt meine Partien vorzeitig.

        Übrigens würde auch ein 10700k oder eine HEDT Maschine das Problem nur etwas hinauszögern. 500k Einwohner in Anno oder C:S sind auch da utopisch, aber ich würde auch in hunderten Stunden Millionenstädte bauen, wenn es den liefe.

        Und all die tolle Middleware wird eben genau für die sein, die du nennst: die Big Player. Nun ist ein Großteil meiner Spiele aber nicht AAA, Paradox bspw. wird so schnell keine fremde Engine bekommen, die tut was in deren Spielen nötig ist. Warum auch? Nur für einen Entwickler wird die Unreal Engine oder ähnliches nicht 10 mal komplexere Berechnungen können und 100 mal mehr Modifikationen enthalten. Genug Indie aentwickler bedienen eine spezifische Nische mit ihrer eigenen Engine. Selbst wenn die mal alle von einer grossen, vereinten SuperEngine ersetzt werden können (GreatUnifiedEngine xD), ist es auf jeden Fall noch Zukunftsmusik und nichtmal nahe.
        Ich jedenfalls spiele Heute und rede über die Zustände Heute. Unter Umständen auch über gestern und die nähere Zukunft, aber was du nennst steht in meinen Spielen jedenfalls nicht gerade vor der Tür.
      • Von Schinken BIOS-Overclocker(in)
        Zitat von 4thVariety
        Würden diese Spiele fundamental besser, wenn man eine 300TDP CPU hätte, die linear zur 100W CPU skaliert? Ich glaube nein. Auch diese Art von Spiel wird in die nächste Generation gehen, aber wir werden sehen, dass CPU Leistung weniger wichtig ist, weil die Aspekte der Weltsimulation über DeepLearning oder MachineLearning abgebildet werden und nicht mehr Brute-Force CPU. Das wird die CPU so wie wir sie kennen nicht ausrechnen, das wird dann die GPU machen, oder eine Hybrid CPU.

        Middleware im Jahr 2020 bedeutet, dass man Unreal Engine mit allen erdenklichen Plugins und Texturpaketen lizenziert. Middleware der Zukunft ist, dass man z.B. eine Version der Alpha Engine von Google lizenziert, die all die Dinge übernimmt, die jetzt eine CPU mit 100W auffressen. Google, Nvidia, Microsoft, Facebook, die würden da gerne alle die Player sein, die so eine Middleware vertreibt. Ki, World State Simulation, Bildschirmphysik, sind alles Aufgaben die in Zukunft von der CPU nicht mehr gemacht werden. Tensor Cores, KI Cores, nennt es wie ihr wollt, spezialisierte Kerne die man mit auf die GPU oder das Chiplet packt und mit CPU sehr wenig zu tun haben.
        Ähm, ja würden sie . Jede Partie endet nämlich weit bevor ich aufhören würde, weil der 3600 nur noch 1-2 FPS liefert.

        Es ist ja schön, wenn du glaubst bei zukünftigen Spielen wird das anders sein. Aber erstens glaubst nur du das und zweitens spiele ich jetzt und beende jetzt meine Partien vorzeitig.

        Übrigens würde auch ein 10700k oder eine HEDT Maschine das Problem nur etwas hinauszögern. 500k Einwohner in Anno oder C:S sind auch da utopisch, aber ich würde auch in hunderten Stunden Millionenstädte bauen, wenn es den liefe.

        Und all die tolle Middleware wird eben genau für die sein, die du nennst: die Big Player. Nun ist ein Großteil meiner Spiele aber nicht AAA, Paradox bspw. wird so schnell keine fremde Engine bekommen, die tut was in deren Spielen nötig ist. Warum auch? Nur für einen Entwickler wird die Unreal Engine oder ähnliches nicht 10 mal komplexere Berechnungen können und 100 mal mehr Modifikationen enthalten. Genug Indie aentwickler bedienen eine spezifische Nische mit ihrer eigenen Engine. Selbst wenn die mal alle von einer grossen, vereinten SuperEngine ersetzt werden können (GreatUnifiedEngine xD), ist es auf jeden Fall noch Zukunftsmusik und nichtmal nahe.
        Ich jedenfalls spiele Heute und rede über die Zustände Heute. Unter Umständen auch über gestern und die nähere Zukunft, aber was du nennst steht in meinen Spielen jedenfalls nicht gerade vor der Tür.
      • Von PCGH_Torsten Kokü-Junkie (m/w)
        Ich hoffe mal, das du Recht hast.
        Als alter Pessimist glaube ich es nur nicht.
        Dafür wurden schon zuviele Patente auf triviale Ideen angemeldet, die sich nicht oder erst Jahre später umsetzen ließen. Was dann teilweise in Patemttrolling endete, wenn nicht der anmelde Nichtskönner, sondern jemand anderem (ohne Wissen über das Patent) die Umsetzung gelang. Leider führt das auch dazu, dass Firmen wie AMD, die nun nicht gerade als Patenttroll bekannt sind, dazu motiviert werden, jeden Fliegenschiss selbst anzumelden nur um sicherzugehen, dass das nicht jemand anders macht und später die Entwicklung behindert.
      • Von Futhark Komplett-PC-Aufrüster(in)
        Zitat von PCGH_Torsten
        Spannend wäre: Wie baut man denn jetzt so einen Interconnect, der so schnell und so latenzarm ist, wie das heutige Rendering-Engines erfordern und zugleich auch noch energieeffizient und so günstig, dass ein Netto-Vorteil gegenüber einer größeren GPU bleibt? Das versucht man seit mindestens 15 Jahren und bislang ist man jedes mal gescheitert. Aber dazu steht im Patent nichts. Erinnert mich an Star-Trek-Autoren: "Wie funktioniert der Heisenbergkompensator?" "Danke der Nachfrage, er funktioniert gut."
        Wenn sie es schaffen, ihre Technik so zu patentieren, dass möglichen Konkurrenten möglichst wenig Information über die neue Technik offenbart wird, während selbige gleichzeitig vollständig vom Patent geschützt ist, haben sie ja alles richtig gemacht. (Klar würde ich auch gerne wissen, wie es im Detail funktioniert!). Ich gehe mal stark davon aus, dass AMD einen guten Patentanwalt hat, der weiß, wie man das formulieren muss, ohne Fehler zu machen ode zu viel zu verraten. Wenn ihre Idee die zukünftigen GPUs schneller macht, freue ich mich aber auf einen entsprechenden Demonstrator.
      • Von Technologie_Texter BIOS-Overclocker(in)
        Zitat von tokthora
        Du schreibst dir so richtig schön einen Quatsch zusammen, das lässt jedem die Nackenhaare hochstehen, anscheinend ist dir die letzte Änderung in der Clustertopologie entgangen, die nicht nur die IPC steigert sondern auch Gamer und damit Devs in diesem Bereich anspricht. Es ist im Falle der Kommunikation viel "günstiger" ein CCC an einen I/O anzubinden und nein, AMD hat überhaupt kein Problem mit den Kosten, weil MCM deutlich günstiger sind als ein monolithisches Design für alles, dann braucht es auch mehrere davon.
        Naja, manche versuchen AMD halt immer klein zu reden, das sollte man einfach ignorieren
      • Von PCGH_Torsten Kokü-Junkie (m/w)
        Nein, es ist nicht "WGP" und es ist auch nicht "HBX". Weil das AMD-Marketingbegriffe sind, die es somit ausschließlich in AMD-Produkten gegeben wird. Aber "Crossfire" war auch nicht SLI und hat trotzdem funktioniert und obwohl es nie ein "Ultrabook" mit AMD-APU geben wird, verkaufen sich dünne, leichte Renoir-Notebooks trotzdem wunderbar (gibt es "Ultrathin" als Kampagne noch?), genauso wie AMD-CPUs ohne "Hyper-Threading". Namen sind Wurscht, das spannende ist die Technik dahinter. Und in dieser Hinsicht ist das Patent verdammt dünn: Chips mit Rechenkernen und Cache, werden über ein spezialisiertes Interface mit Chips mit gleichberechtigten Chips verbunden. Die ebenfalls Rechenkerne und Caches enthalten, welcher direkt zugänglich ist.

        Keine Ahnung, wer so etwas als erster gebaut hat, aber unter den x86-Nachzüglern fand man es erstmals bei Dual-Pentium-Pro- beziehungsweise, wenn du auf größere Zahlen bestehst, Quad-Xeon-Slot-2-Systemen. Damals hieß das Interface noch "FSB" und die Recheneinheiten trugen ein "C" statt einem "G" vor dem PU und niemand hatte "Chiplet" in eine Ecke gekritzelt. Aber auf die Idee, dass es "schnell" und "machbar" sein sollte, war man bereits gekommen. Und spätestens mit der Voodoo 5 hat jemand die Idee auch schon mal auf einem gemeinsamen Substrat, ohne zentralen I/O-Chip und für 3D-Rendering umgesetzt. Das sind alles antike Ideen. Genauso Punkt-zu-Punkt Interfaces für die Verbindung gleichberechtigter Chips (x86-Markt seit dem ersten Multi-CPU-Opteron, bei IBM oder Cray afaik schon vorher) oder Si-Interposern für zusammenarbeitende Chip-Cluster (z.B. bei Xilinx schon 2011).

        Spannend wäre: Wie baut man denn jetzt so einen Interconnect, der so schnell und so latenzarm ist, wie das heutige Rendering-Engines erfordern und zugleich auch noch energieeffizient und so günstig, dass ein Netto-Vorteil gegenüber einer größeren GPU bleibt? Das versucht man seit mindestens 15 Jahren und bislang ist man jedes mal gescheitert. Aber dazu steht im Patent nichts. Erinnert mich an Star-Trek-Autoren: "Wie funktioniert der Heisenbergkompensator?" "Danke der Nachfrage, er funktioniert gut."

        Disclaimer: Letzterer Satz soll AMD nicht unterstellen, hier etwas vorzutäuschen, was sie gar nicht bauen können. Er soll nur unterstreichen, dass sie bislang nirgendwo verraten, wie sie die denn den heiligen Gral gefunden haben. Aber das wäre das einzig spannende, denn danach Suchende gibt und gab es zu genüge.
      Direkt zum Diskussionsende
  • Print / Abo
    Apps
    PCGH Magazin 07/2026 PC Games 06/2026 play5 07/2026 N-Zone 06/2026 Linux Magazin 06/2026 LinuxUser 06/2026 Raspberry Pi Geek 07/2026
    PC Games Hardware PC Games Linux Magazin Raspberry Pi Geek Computec Kiosk