Überraschendes GPU-Gerücht: Auf Blackwell folgt Rubin - und das erstaunlich schnell

14
News Oliver Jäger Als bevorzugte Quelle auf Google hinzufügen
Überraschendes GPU-Gerücht: Auf Blackwell folgt Rubin - und das erstaunlich schnell
Quelle: Nvidia

Bei Nvidia steht als Nächstes die Blackwell-GPU-Generation an, sowohl im HPC/KI- als auch Consumer-Bereich. Schon jetzt gehen Gerüchte zum Nachfolger um, und der soll recht schnell folgen.

Bei der vergangenen Hausmesse GTC im März stellte Nvidia die Blackwell-Architektur samt KI-Chip B200 und Dual-Die-GPU GB200 vor. Gleichzeitig wird es bei den dedizierten Consumer-Grafikkarten Tag für Tag konkreter. Doch die ersten Spekulationen aus der Branche und von Leakern über die Nachfolge-Architektur schwirren schon durchs Netz.

Rubin für Rechenzentren schon im nächsten Jahr?

So hat der Analyst Ming-Chi Kuo auf Medium.com einige Prognosen zur Nachfolgegeneration von Blackwell abgegeben, die den Codenamen "Rubin" tragen soll. Bei Rubin bliebe sich Nvidia weiterhin treu und würde als Paten für den Codenamen einen weiteren Wissenschaftler auswählen. Nach Ada Lovelace wäre es wieder eine Frau, nämlich Vera Rubin, die eine US-amerikanische Astronomin gewesen ist und sich hauptsächlich mit dunkler Materie beschäftigte.

Passend zum Namen sollen die KI-Chips der R-Serie angehören, mit dem R100 als Nachfolger des B100 (Blackwell). Kuo glaubt, dass die Massenfertigung der Rechenzentren-Chips im vierten Quartal 2024 stattfindet und nennt einige weitere Prognosen zu den technischen Daten der Rubin-Reihe:

  1. Der R100 wird den N3-Node von TSMC (im Gegensatz zum N4P von TSMC für den B100) und das CoWoS-L-Packaging (wie beim B100) verwenden.
  2. Der R100 verwendet ein etwa vierfaches Reticle-Design (im Gegensatz zum 3,3-fachen des B100).
  3. Die Interposer-Größe für R100 ist noch nicht endgültig festgelegt. Es gibt zwei bis drei Optionen.
  4. R100 wird mit acht HBM4-Einheiten ausgestattet sein.
  5. Die Grace-CPU des GR200 wird den N3-Prozess von TSMC verwenden (gegenüber dem N5-Prozess von TSMC für die Grace-CPU des GH200 und GB200).
  6. Nvidia ist sich bewusst, dass der Stromverbrauch von KI-Servern zu einer Herausforderung für die Beschaffung und den Bau von Rechenzentren geworden ist. Daher konzentrieren sich die Chips und Systemlösungen der R-Serie auf die Verbesserung des Stromverbrauchs und die Steigerung der KI-Rechenleistung.

- Ming-Chi Kuo -

Auch interessant: Geforce RTX 5000 ("Blackwell"): Nvidia soll Kühllösungen mit bis zu 600 Watt testen

Der Twitter-Nutzer und Leaker "AGF" erachtet die Prognosen des Branchenanalysten derweil als falsch und nennt seinerseits "Fakten". Der Tape-out von R100 erfolge demnach schon diesen Sommer. Des Weiteren werden die Chips für Rechenzentren weiterhin das CoWoS-L-Packaging verwenden, wie auch Kup glaubt, allerdings auf HBM3e- statt HBM4-Speicher setzen. Das würde bedeuten, dass mit einer Veröffentlichung der Chips etwa ein Jahr später zu rechnen wäre, also beginnend mit der zweiten Jahreshälfte 2025.

Empfohlener redaktioneller Inhalt [EMBED_URL] An dieser Stelle finden Sie externe Inhalte von [PLATTFORM]. Zum Schutz Ihrer persönlichen Daten werden externe Einbindungen erst angezeigt, wenn Sie dies durch Klick auf "Alle externen Inhalte laden" bestätigen: Ich bin damit einverstanden, dass mir externe Inhalte angezeigt werden. Damit werden personenbezogene Daten an Drittplattformen übermittelt. Mehr dazu in unserer Datenschutzerklärung.
Externe Inhalte Mehr dazu in unserer Datenschutzerklärung.

Nvidia würde damit auch seinen bisherigen Rhythmus von zwei Jahren bei der Vorstellung und Veröffentlichung neuer HPC/KI-Chips brechen. Ob Rubin wie Blackwell auch eine Architektur für Consumer-Grafikkarten sein wird, ist noch in Zweifel zu stellen. Nvidia ist als Platzhirsch im GPU-Geschäft nicht wirklich dazu gezwungen, rasch neue Generationen an Desktop-Grafikkarten an den Kunden zu bringen.

Quelle: Ming-Chi Kuo, AGF

14
    • Kommentare (14)

      Zur Diskussion im Forum
      • Von Waupee Software-Overclocker(in)
        Pah 2000€ mal abwarten wen die 5090er erscheinen und die UVP steht wird bestimmt lustig
      • Von Waupee Software-Overclocker(in)
        Pah 2000€ mal abwarten wen die 5090er erscheinen und die UVP steht wird bestimmt lustig
      • Von DevouringKing Software-Overclocker(in)
        Zitat von The_Invisible84
        Stimmt du wirst ja dazu gezwungen so eine zu kaufen. Genauso wie den Ferrari den du kaufen MUSST.

        Lol also manche Kommentare immer...
        Gezwungen ist niemand, dennoch kaufen mehr leute eine RTX4090 für 2000€ als eine Preis Leistungs gute Radeon RX7900GRE für 500€ die mehr FPS pro EURO in 99% der fälle bei zb 1080p oder 1440p bietet, und nur bei 4k mit Raytracing evtl gleichauf ist was fps pro Euro betrifft.
        Nvidia nutzt gezielt die Psyche der Menschen. Immer das beste haben zu wollen.
      • Von The_Invisible84 Software-Overclocker(in)
        Zitat von aluis
        Jo, jedes Jahr ne xx90 für 2000 Euro+. Kein Problem für den Enthusiasten
        Stimmt du wirst ja dazu gezwungen so eine zu kaufen. Genauso wie den Ferrari den du kaufen MUSST.

        Lol also manche Kommentare immer...
      • Von CD LABS: Radon Project Lötkolbengott/-göttin
        Zitat von theGucky
        Das ist nur ein Gerücht von vielen ohne große Aussagekraft.
        Es ist zumindest ein Gerücht, das aus vielen verschiedenen Richtungen Unterstützung erhielt.
        Zitat von theGucky
        Beim B100 macht es noch Sinn, da 800mm² eine Grenze in der Herstellung ist.
        Definitiv. Das war die Motivation für die Entwicklung des 2-Die-Interconnects.
        Zitat von theGucky
        Aber beim GB202, welcher sicherlich wieder nur 600mm² ist, wird ja keine Grenze erreicht.
        Korrekt. Aber nun ist das 2-Die-Interconnect eben bereits entwickelt.
        Zitat von theGucky
        Einzig bei der Herstellung lässt sich minimal was sparen. es passen ja mehr (2x)300mm Chips auf einen Wafer als 600mm².
        Und das sind keine geringen Gewinne. Dazu kommt der bessere Yield. (die gleiche Anzahl kleiner Fehler pro DIE betreffen dann weniger)
        Zitat von theGucky
        Aber wenn ich daran denke, das man z.b. nur GB203 herstellt und die dann variiert zu 5080 und 5090, würde man 2 Artikel zu einem machen, das wäre in der Logistik einfacher...nur würde man Chipfläche für den Interconnect verschwenden wens auf eine 5080 kommt. Und Chipfläche kostet wieder Geld...
        Die Logistik wäre einfacher, aber Nvidia arbeitet in letzter Zeit lieber mit vielen Chipvarianten, um dann möglichst viele teilintakten/teildefekten Chips weiterverwenden zu können. Manchmal gibt es eine Karte sowohl mit großem als auch kleinen Chip, nur dass dann einmal der große Chip so stark gecutted wurde, bis er logisch dem kleinen entspricht.
        Zitat von theGucky
        Die Karte so stark zu beschneiden, aber gleichzeitig 2 Chips zusammenkleben macht gar keinen Sinn.
        Die Verbindung zwischen den beiden Chips muss schließlich perfekt sein, damit das auch richtig läuft.
        Die beschnittenen Chips sind sehr günstig, sie sind ja fast schon Ausschussware. Gleichzeitig steht, wie gesagt, das 2-DIE-Interconnect grundsätzlich bereits. (und es würde dann ja später auch für die 6090 weiterverwendet werden)
        Zitat von theGucky
        ICH gehe davon aus, das wenn überhaupt mal 2xGB203 zum Einsatz kommt, dass es bei den Quadros sein wird aber nicht bei der 5090.
        Und natürlich auch für die Quadros und Teslas. Und ja, ich gehe davon aus, dass die Quadros und Teslas schon früh mit einer gut ausgebauten Variante versorgt werden. Aber das war bei Ada ja auch schon der Fall. Der AD102 auf der 4090 ist ja im Vergleich zum Vollausbau eine Lachnummer, was auf L40 und RTX 6000 Ada Generation zu sehen war spielt in einer ganz anderen Klasse.
      • Von G4mest3r BIOS-Overclocker(in)
        Das glaube ich erst, wenn es [Ins Forum, um diesen Inhalt zu sehen] auf der Bench-Bank hatte.
        Vorher sind GPUs für mich nicht "existent"
      Direkt zum Diskussionsende
  • Print / Abo
    Apps
    PCGH Magazin 07/2026 PC Games 07/2026 play5 07/2026 N-Zone 07/2026 Linux Magazin 07/2026 LinuxUser 07/2026 Raspberry Pi Geek 07/2026
    PC Games Hardware PC Games Linux Magazin Raspberry Pi Geek Computec Kiosk