Nvidia forscht an Multi-Chip-Modulen für Grafikkarten

70
News Andreas Link Carsten Spille Als bevorzugte Quelle auf Google hinzufügen
Nvidia forscht an Multi-Chip-Modulen für Grafikkarten (3)
Quelle: Nvidia

Führt langfristig kein Weg an Multi-GPU vorbei? Während manche beim Gedanken daran direkt drei graue Haare mehr haben, forscht Nvidia zumindest für den Tag, an dem monolithische, sprich einzelne große GPUs ausgedient haben, weil der Fertigungsprozess nicht mehr verkleinert werden kann. Die Antwort auf das Skalierungsproblem könnte Multi-Chip-Module lauten.

Grafikkarten sind heute das Thema bei Hardware-Enthusiasten. Hier fand in der Vergangenheit die meiste Leistungsentwicklung statt und heutzutage operieren Spiele in der Regel im Grafikkartenlimit, weshalb hier besonders viel Aufmerksamkeit gefragt ist. Doch wie geht es weiter? Performance-Gewinne bei Grafikkarten finden wie auch bei CPUs über drei elementare Säulen statt:

  • Verbesserung der Architektur
  • Größere Chips mit mehr Recheneinheiten
  • Höherer Takt.

Verbesserungen der Architektur alleine erlauben heute aber keine immensen Sprünge mehr und die beiden letzten Punkte sind maßgeblich von der Fertigungsgröße des Chips abhängig.

Alle drei Punkte greifen zusammen und hängen daran, dass künftig noch feinere Siliziumplättchen belichtet werden können. Doch diese Reise der feineren Strukturen wird irgendwann ein Ende nehmen, ebenso wie die Vergrößerung des Chips. Gut 800 mm² werden als Ende der Fahnenstange angesehen, Pascal hat maximal 610 mm², Volta 815 mm². Die maximale Belichtungsgröße eines entsprechenden Gerätes wie dem Twinscan NXT 1950i von ASML liegt bei 26,0 × 33,0 mm. Und dann? Stillstand?

Nvidia wie auch AMD versuchen daher zumindest in der Forschungsabteilung sein Glück mit Multi-Chip-Module GPUs (MCM-GPU). An denen wird gerade zusammen mit der Arizona State University, der University of Texas und dem Barcelona Supercomputing Centre geforscht und sie könnten künftige Leistungssteigerungen sichern.
Nvidia forscht an Multi-Chip-Modulen für Grafikkarten (1) Quelle: Nvidia Nvidia forscht an Multi-Chip-Modulen für Grafikkarten (1) Multi-Chip-Module sind aus "einfachen" GPU-Kernen bestehende Module, und von den GPU-Kernen sind es viele. Quasi so etwas wie SLI nur in anderem Maßstab oder Intels Many-Core-Projekt. Oder noch besser so ähnlich wie AMD es aktuell bei Ryzen macht. Vom 4- bis zum 16-Kerner steckt überall das gleiche Grundmodul drin, teilweise mehrfach ausgeführt und mit dem flexiblen Infinity Fabric als schnellem Interconnect verbunden.

Hardware-Enthusiasten werden nun angesichts der bekannten Probleme von Multi-GPU-Lösungen schon graue Haare haben, aber grundsätzlich sollte neuen Technologien eine Chance gegeben werden und die vollmundigen Versprechen lauten derzeit, ohne sie überprüfen zu können, dass die Multi-Chip-Module besser skalieren und dank schnellen Interconnects weniger (mikro)ruckeln sollten. Allerdings sind sämtliche Simulationen erst einmal anhand gut parallelisierbarer und für Probleme wie Mikroruckeln eher weniger anfälligen, allgemeinen Algorithmen durchgeführt worden.

Man darf die Technologie also eher als das verstehen, was jetzt auch schon auf Grafikkarten-Chips passiert: Die Kombination mehrerer Rechencluster zu einem großen Chip; beispielsweise beim GP102 28 SMs zu 64 Cuda-Kernen, was zu 3.584:224:88 (Shader/TMU/ROP) führt.

Und so wird auch verglichen: Eine MCM-Lösung mit 256 (4×64) SMs (Streaming Multiprocessor) und 1 GHz soll auf dem Papier 45,5 Prozent flotter sein als die größtmögliche monolithische GPU mit 128 SMs. Durch den einfachen Aufbau sollen sich die MCM-Module auch leichter in größeren Mengen kombinieren lassen als bisherige Rechencluster, von denen die schnellste Pascal-Karte Tesla P100 56 hat (GP100 insgesamt 60), die gerade vorgestellte V100-GPU bis zu 84, von denen auf der Tesla V100 jedoch nur 80 aktiv sind.

Auf dem Papier wurde ein MCM-Setup auch gegen ein klassisches SLI-Setup mit gleicher Menge an Rechenkernen gestellt und da sollen es 26,8 Prozent Mehrleistung sein. Eine SLI-Lösung soll sich aber nicht so gut skalieren lassen wie die MCM-Lösung. Eine vergleichbar ausgestattete monolithische GPU wäre zwar nach wie vor mit rund 10 Prozent Abstand in Schlagdistanz, lässt sich laut der Forscher aber mit heutigen Möglichkeiten nicht konstruieren. Nvidia forscht an Multi-Chip-Modulen für Grafikkarten (2) Quelle: Nvidia Nvidia forscht an Multi-Chip-Modulen für Grafikkarten (2) Klar ist, dass die Fertigungsprozesse sich nicht mehr in dem Tempo verkleinern lassen, wie man das in den vergangenen Jahren gewohnt war. Die ersten Effekte davon hat man schon erlebt, etwa bei Intel, wo schon die letzten beiden Fertigungsprozesse mehr Probleme machten, als man gerne gehabt hätte. An anderen Basismaterialien wird geforscht, marktreif ist davon aber nichts. Ebenso wie das MCM-Konzept von Nvidia. Sollte es jemals zur Marktreife reichen, dürfte das fertige Produkt noch einige Zeit auf sich warten lassen. Ebenso wie bei AMD, wo man ebenfalls an ähnlichen Projekten forscht.

70
    • Kommentare (70)

      Zur Diskussion im Forum
      • Von DKK007 Trockeneisprofi (m/w)
        Angeblich will Intel auch seine Fertigung umbenennen um nicht mehr ganz so hinterher zu hinken.
        Oder war das wie bei VW ein April-Scherz?

        In Zeiten wo Verschwörungstheroretiker und Covidioten jeden Quatsch für wahr halten gar nicht so einfach FakeNews von Aprilscherzen und Satire zu unterscheiden.
      • Von DKK007 Trockeneisprofi (m/w)
        Angeblich will Intel auch seine Fertigung umbenennen um nicht mehr ganz so hinterher zu hinken.
        Oder war das wie bei VW ein April-Scherz?

        In Zeiten wo Verschwörungstheroretiker und Covidioten jeden Quatsch für wahr halten gar nicht so einfach FakeNews von Aprilscherzen und Satire zu unterscheiden.
      • Von PCGH_Torsten Kokü-Junkie (m/w)
        1 nm physisch gilt als machbar in Silizium, aber das hat nichts mit einem "1nm"-Node bei TSMC zu tun. Nach dem, was man so hört, dürfte deren "3nm" keine feineren Strukturen als 5 nm enthalten und somit noch Luft für vier-fünf weitere Nodes. Zusätzlich zu den zweien, die bei x86-CPUs noch bis 3 nm anstehen und im Schnitt 2-3 Jahren je Node ist die Entwicklung also bis 2035, mit etwas langsameren Zyklen bis 2040 absehbar. Zum Vergleich: VOR 7 Nodes war 2002 und Intel veröffentlichte gerade den Northwood-Pentium-4 in 130 nm.
      • Von Nebulus07
        Zitat

        n, weil der Fertigungsprozess nicht mehr verkleinert werden kann.
        [Ins Forum, um diesen Inhalt zu sehen]

        [Ins Forum, um diesen Inhalt zu sehen]

        UUUUND hier mal eine NEWS von 2017 !!!!
        [Ins Forum, um diesen Inhalt zu sehen]

        VON 2017:
        Zitat

        Laut NVIDIA hat Morres Law nur noch durch die Parallelisierung in den vergangenen Jahren bestand. Die Instruktion Pipelines wurden immer größer, um die Single-Threaded-Anwendungen zu beschleunigen. Weitere Optimierungen wie Caches-Hirarchien und Instruktionen wurden ebenfalls immer komplexer, um diese Bedürfnisse zu erfüllen.
        Experten sind sich einig, durch die Thinfet Technologie sind auch 1nm Transistoren möglich. Auch noch kleiner unter 1nm! Dann ist aber auch mit dem 3D Transistor schluß. 1nm soll 2025-2028 kommen... Was danach kommt, weiß niemand...
      • Von yingtao BIOS-Overclocker(in)
        AW: Nvidia forscht an Multi-Chip-Modulen für Grafikkarten

        Zitat von TheGoodBadWeird
        ...

        Das dürfte am geringeren Takt und der steigenden benötigten Bandbreite liegen. Es gibt bei diesen ersten Prototypen / Konzeptmodellen sicher noch unendlich viele Flaschenhälse, weshalb die Leistung nicht linear ansteigen kann.

        Es ist hierbei die Frage wie gut die Kommunikation innerhalb der Architektur arbeitet. Im Multiplexszenario steigen die Anforderungen mit jeder neu angeflanchten Teil-GPU massivst an.

        Der Scheduler müsste wohl auch stark überarbeitet werden. Für das fertige Produkt müsse man die Verhältnisse sehr genau anpassen, was bei dieser Studie sicher nicht passiert ist. Sie is wohl nur ein absolutes Grobkonzept um das potential aufzuzeigen.

        Ein monolitischer Chip würde auch nicht endlos skalieren. Das Ergebnis kommt sicher auf die individuelle Konfiguration an. Primär dürfte MCM eher eine Technik zur Kostenreduzierung und Umgehung von Fertigungslimits sein. Um die eigentliche Leistung müssen sich dann die Ingenieure in der Entwicklung kümmern.
        Es gibt keine Prototypen. Im Paper wird genau erklärt wie diese Simulationen vorgenommen wurden. Es wurde Nvidias in-house Simulator genutzt um theoretische GPUs zu bauen und hat dann Benchmarks auf diesen theoretischen GPUs laufen lassen. Die Durchgeführten Benchmarks haben alle unterschiedliche Skalierungen. Einige lassen nur eine sehr geringe Parallelisierung zu, einige eine hohe und einige eine perfekte wodurch sich eine lineare Skalierung ergibt. Es wurden keine Prototypen gebaut weil man aktuell keinen bauen kann. Die einzelnen MCM Dies sind zu groß. Man geht davon aus das bald Substrat Packages von 77mm Kantenlänge möglich sind was groß genug ist für einen ersten Prototypen. Die Zahlen die angegeben werden sind aktuell denkbare Best-Case-Szenarien. Die 45,5% sind ein gemittelter Wert aus 48 Benchmarks in denen ein theoretischer MCM in 31 Tests schneller (bis zu 3,5x schneller) war, in 9 Tests langsamer (-4,7%) und in den restlichen 10 Tests kein Unterschied.

        Das es keine lineare oder bessere Skalierung gibt wird im Paper so erklärt das die Transistoren nicht besser skalieren können und es dadurch Flaschenhälse gibt. Diese lassen sich nicht vermeiden wodurch man bei MCM auf viele kleine Pakete mit weniger SM setzt. Interessanter ist die nächste Simulation wo ein SLI System modelliert wurde aus 2x128SM und auch dort ist die MCM GPU schneller. 51,9% mit aktueller SLI Skalierung und 25,1% mit optimierter SLI Skalierung.

        Das Paper klingt nicht danach das man versucht über MCM Kosten zu sparen sondern um die Leistung weiter steigern zu können. Im Paper geht man davon aus das ein einzelner Die mit 128 SM das Limit ist weil danach die Verluste im Vergleich zum Leistungsgewinn zu groß sind. Was für Möglichkeiten bestehen wenn man nicht mehr Leistung aus einer einzelnen GPU holen kann? Man nutzt mehrere GPUs, jedoch gibt es auch dort Flaschenhälse die man durch MCM umgehen will. Durch die vielen, kleinen Dies werden vielleicht die Kosten geringer ausfallen als bei riesen Dies mit 800mm² aber ich denke nicht dass es das Primärziel ist.
      • Von Kizna PC-Selbstbauer(in)
        AW: Nvidia forscht an Multi-Chip-Modulen für Grafikkarten

        Zitat von JTRch
        Meines Wissens sind nicht mal Mikroruckler das Hauptproblem, sondern die Synchronisation der Frame-Times der beiden GPUs und damit oft zunichte machende Latenz. Oft bei meinem SLI erlebt, dass sich 60 FPS wie 30 FPS angefühlt haben.
        Synchronisation ist in der tat das nummer eins Problem bei jeder Parallelisierung.

        Aber die ansätze für MCM ist ja nicht Zwei GPUs. Sondern eine GPU mit mehreren DIEs.

        Oder eben das quasi zusammenfügen von mehreren GPUs zu einer "einzigen".
      Direkt zum Diskussionsende
  • Print / Abo
    Apps
    PCGH Magazin 08/2026 PC Games 07/2026 play5 08/2026 N-Zone 07/2026 Linux Magazin 07/2026 LinuxUser 07/2026 Raspberry Pi Geek 07/2026
    PC Games Hardware PC Games Linux Magazin Raspberry Pi Geek Computec Kiosk