AMD Instinct MI250X: CDNA2-GPU angeblich mit 128 GB HBM2e, 48 TFLOPs und 500W

News 24.10.2021 um 17:00 Uhr Valentin Sattler Als bevorzugte Quelle auf Google hinzufügen

Quelle: AMD

Laut dem Leaker Executable Fix soll AMD an einem neuen GPU-Beschleuniger namens Instinct MI250X arbeiten. Dieser soll 110 CUs bei 1,7 GHz bieten und damit 48 TFLOPS im FP64Format erreichen. Dazu gibt es 128 GB HBM2e-Speicher und eine TDP von 500 W.

Mit der Einführung der RDNA-Architektur löste AMD nicht nur die bis dahin verwendete GCN-Architektur ab, sondern das Unternehmen führte zugleich auch eine zweite Architektur namens CDNA ein, die sich an GPU-Beschleuniger richten sollte. Doch während es für den Endkunden-Markt mit RDNA2 schon seit rund einem Jahr einen ersten Nachfolger gibt, gibt es im professionellen Segment bis heute nur GPUs auf Basis der ursprünglichen CDNA-Architektur.

CDNA2 angeblich deutlich schneller

Dass sich das bald ändern soll, ist aber schon lange kein Geheimnis mehr: Schon lange schwirrt eine CDNA2-GPU namens Aldebaran in der Gerückteküche herum. Neues Futter zu dem GPU-Beschleuniger gab es dabei jüngst vom Leaker Executable Fix: Auf Twitter veröffentlichte dieser angebliche Spezifikationen und Leistungsdaten zu einem neuen GPU-Beschleuniger namens Instinct MI250X, der auf Aldebaran setzen und das aktuelle Flaggschiff, den Instinct MI100, ablösen soll. Zudem behauptet Executable Fix, dass ein weiteres Modell namens Instinct MI250 geplant ist.

Empfohlener redaktioneller Inhalt [EMBED_URL] An dieser Stelle finden Sie externe Inhalte von [PLATTFORM]. Zum Schutz Ihrer persönlichen Daten werden externe Einbindungen erst angezeigt, wenn Sie dies durch Klick auf "Alle externen Inhalte laden" bestätigen: Ich bin damit einverstanden, dass mir externe Inhalte angezeigt werden. Damit werden personenbezogene Daten an Drittplattformen übermittelt. Mehr dazu in unserer Datenschutzerklärung.

Externe Inhalte Mehr dazu in unserer Datenschutzerklärung.

Wenn die in dem Leak präsentierten Daten korrekt sind, dann werden die neuen Instinct-GPU deutlich besser ausgestattet als die aktuellen Modelle. Demnach setzt die Instinct MI250X zwar nur noch auf 110 statt 120 CUs, doch dafür gibt es den vierfachen Speicher und einen um 200 MHz höheren Takt.

Auch interessant: Intel XE-HPG-Schnitzeljagd: Hohe Preise für Intels neue GPUs

Produkt	Instinct MI100	Instinct MI250	Instinct MI250X
Architektur	CDNA 1	CDNA 2	CDNA 2
GPU	Arcturus	Aldebaran	Aldebaran
Fertigung	7 nm	7 nm	7 nm
CUs	120	-	110
Boost-Takt	1500 MHz	-	1700 MHz
FP64	11,5 TFLOPs	-	47,9 TFLOPs
FP32	23,1 TFLOPs		-
FP16	184,6 TFLOPs	-	383,0 TFLOPs
Speicher	32 GB HBM2	-	128 GB HBM2e

Gleichzeitig soll außerdem auch die Leistung deutlich ansteigen: Laut Executable Fix erreicht die Instinct MI250X im FP64-Format knapp 48 TFLOPs, womit das Modell etwas mehr als viermal so schnell wäre wie eine aktuelle MI100. Zudem soll es auch bei FP16-Berechnungen eine deutlich Verbesserung geben - hier ist die Rede von etwas mehr als der doppelten Leistung. Bei der Effizienz ist hingegen kein ganz so großer Sprung vorgesehen, denn die Instinct MI250X soll nicht nur schneller sein, sondern auch deutlich mehr verbrauchen. Angeblich liegt die TDP bei 500 W, während die Instinct MI100 "nur" mit 300W spezifiziert ist.

Quelle: via Videocardz

Artikel teilen

AMD Instinct MI250X: CDNA2-GPU angeblich mit 128 GB HBM2e, 48 TFLOPs und 500W Laut dem Leaker Executable Fix soll AMD an einem neuen GPU-Beschleuniger namens Instinct MI250X arbeiten. Dieser soll 110 CUs bei 1,7 GHz bieten und damit 48 TFLOPS im FP64Format erreichen. Dazu gibt es 128 GB HBM2e-Speicher und eine TDP von 500 W.

Per E-Mail versenden

- Kommentare (15)
  Zur Diskussion im Forum
  
  Von Zappaesk Volt-Modder(in)
  
  Alles richtig, nur hat das nichts mit dem Gesamtverbrauch zu tun! Du musst immer die Rechenleistung mit hinzuziehen in die Betrachtung. Wenn ein System das doppelte verbraucht ist das immer noch und auch in Zukunft zu rechtfertigen, wenn es gleichzeitig mehr als doppelt so schnell ist.
  
  Zitieren
  
  Von Zappaesk Volt-Modder(in)
  
  Alles richtig, nur hat das nichts mit dem Gesamtverbrauch zu tun! Du musst immer die Rechenleistung mit hinzuziehen in die Betrachtung. Wenn ein System das doppelte verbraucht ist das immer noch und auch in Zukunft zu rechtfertigen, wenn es gleichzeitig mehr als doppelt so schnell ist.
  
  Zitieren
  
  Von gerX7a BIOS-Overclocker(in)
  
  Die aktuellen Supercomputer sind zunehmend auf Effizienz getrimmt, also Performance/Watt. Die letzten Topsysteme reizen schon längst nicht mehr das maximal technisch Mögliche auf Teufel komm raus aus, sprich maximal möglicher Takt der einzelnen Komponenten und dafür eine extrem aufwändige Kühlung, etc. Das wird sich auch Zukünftig immer mehr in diese Richtung bewegen, insbesondere bei den extrem großen Systemen, die für Exascale-Performance ausgelegt sind und daher extrem viele Racks mit relativ hohem Verbrauch inkludieren.
  Das aktuelle Topsystem ist der Fugaku mit 0,44 ExaFlops bei rd. 30 MW. Man darf gespannt sein wo sich hier der Frontier und Aurora einsortieren werden.
  
  Zitieren
  
  Von Zappaesk Volt-Modder(in)
  
  Zitat von gerX7a
  
  Die 110 CUs werden zweifellos nicht der Vollausbau sein, jedoch darf man annehmen, dass es keine größeren Modelle jenseits der MI250X geben wird, denn limitierend ist hier die gesamte TP eines Blades. Hier werden voraussichtlich 4 Karten zusammen (mit einer 250 - 300 W CPU) betrieben und über ein gewisses kW-Limit pro Rack kommt man nicht sinnvoll hinaus, wenn man nicht unverhältnismäßige Aufwände betreiben will und selbst die lassen sich heute schlecht rechtfertigen, denn nicht umsonst gibt es mittlerweile auch eine Green500-Liste, in der die Effizienz das A und O darstellt.
  
  Ich gebe dir recht, dass ein gewisses Leistungslimit pro Rack gilt, wenn man den Aufwand nicht ins Uferlose ausarten lassen will. Nur den Verweis mit der Green500 Liste und die von dir angesprochenen Rechtfertigungsprobleme begreife ich nicht. Da geht es um die Effizienz, nicht um den Absolutverbrauch.
  
  Zitieren
  
  Von gerX7a BIOS-Overclocker(in)
  
  Zitat von pipin
  
  Die Dinger sind schon fertig, da sie unter anderem im Supercomputer Frontier zum Einsatz kommen.
  Angeblich werden sie auch im November zur SC21 offiziell präsentiert.
  
  Die 110 CU sind wohl nicht fix, da nicht der Vollausbau zwecks Redundanz und damit bessere Yields.
  
  Das mit interessanteste ist ja, dass es ein MCM-Design ist.
  
  Nicht nur angeblich sondern höchstwahrscheinlich, denn selbstredend will man die Aktualisierung der Top500-Liste im November mitnehmen, denn die nächste ist erst im Juni 2022 und da muss man sich bereits wieder gegen nVidia und Intel vergleichen lassen.
  Zwar könnte man aufgrund der Größe des Frontier vielleicht die absolute Krone übergangsweise beibehalten, jedoch wird bspw. zweifellos nVidia für die Jahresmitte bereits eines ihrer Cluster mit Hopper aktualisiert haben und der wird absehbar dessen Überlegenheit demonstrieren, denn mit alleine schon den verwendeten 5nm hat das Design einen gehörigen Pluspunkt auf seiner Seite.
  
  Die 110 CUs werden zweifellos nicht der Vollausbau sein, jedoch darf man annehmen, dass es keine größeren Modelle jenseits der MI250X geben wird, denn limitierend ist hier die gesamte TP eines Blades. Hier werden voraussichtlich 4 Karten zusammen (mit einer 250 - 300 W CPU) betrieben und über ein gewisses kW-Limit pro Rack kommt man nicht sinnvoll hinaus, wenn man nicht unverhältnismäßige Aufwände betreiben will und selbst die lassen sich heute schlecht rechtfertigen, denn nicht umsonst gibt es mittlerweile auch eine Green500-Liste, in der die Effizienz das A und O darstellt.
  
  Zitat von onkel-foehn
  
  Mir wäre eine 6950 XTX mit 32 GB HBM2e lieber
  
  MfG Föhn.
  
  Davon träumt so mancher, nur die Kosten will keiner tragen und AMD offensichtlich am allerwenigsten. Sollte HBM2E mal in Consumer-Designs kommen, wird das wohl zuerst bei nVidia oder Intel stattfinden. AMD ist dafür noch viel zu beschränkt mit ihren kleinen Marktanteilen. Selbst bei Intel wäre dies vorerst eher unwahrscheinlich i. V. z. nVidia, aber die haben wenigsten die nötigen Ressoucen, wenn sie ein Produkt tatsächlich pushen wollten, wobei nach aktuellem Stand da eher keine Notwendigkeit besteht, da man mit den bald zur Anwendung kommenden noch kleineren Nodes noch deutlich besser einen großen Cache realisieren kann (direkt auf dem Wafer oder "angeflanscht") und sich daher im Last Level weiterhin mit bewährter und günstiger GDDR6-Technik arrangieren kann und dafür eine bessere Marge einfährt. Die NextGen-GPUs der drei großen (2HJ22 - 1HJ23) werden für Consumer vermutlich weiterhin alle ausnahmslos auf GDDR6 aufsetzen.
  
  Zitieren
  
  Von hanfi104 Volt-Modder(in)
  
  Zitat von onkel-foehn
  
  Mir wäre eine 6950 XTX mit 32 GB HBM2e lieber
  
  MfG Föhn.
  
  Aber bitte in RDNA3. 2 ist ende nächsten Jahres laaangweilig
  
  Zitieren
  
  Direkt zum Diskussionsende

Hoch

Print / Abo

Apps

Die Redaktion Datenschutz Artikel-Archiv Datenschutz-Optionen Mediadaten Impressum Utiq verwalten Abo kündigen Vertrag widerrufen AGB Inhalt melden Newsletter

CDNA2 angeblich deutlich schneller

Artikel teilen

Kommentare (15)