Kampf der Titanen: AMD jagt Nvidia mit dem KI-Beschleuniger Instinct MI300X

18
News Roland Austinat (US-Korrespondent) Als bevorzugte Quelle auf Google hinzufügen
AMD jagt Nvidia mit dem KI-Beschleuniger Instinct MI300X (2)
Quelle: AMD

AMD präsentierte auf einem Event in San Francisco den KI-Beschleuniger Instinct MI300X - eine deutlich aufgebohrte Fassung der auf der letzten CES angekündigten Instinct MI300.

KI lohnt sich: Das Marktpotenzial der In-Technologie soll nach internen AMD-Schätzungen von heute 30 Milliarden Dollar in den nächsten vier Jahren auf 150 Milliarden Dollar steigen. Klar, dass auch AMD ein Stück vom Kuchen abhaben möchte, den bislang Nvidia mit den A100- beziehungsweise H100-Systemen für sich alleine futtern konnte. Auf der CES 2023 kündigte AMD-CEO Dr. Lisa Su bereits den KI-Beschleuniger Instinct MI300A an, im Rahmen eines AMD-Events in San Francisco gab es Neuigkeiten zu diesem Thema.

192 GByte für ein Halleluja

AMD drückt ausgewählten Partnern derzeit den Anfang des Jahres vorgestellten KI-Beschleuniger Instinct MI300A zu Testzwecken in die Hand. Der in einer Kombination aus 5- und 6-nm-Technik gefertigte Chip besitzt 24 Zen-4-Kerne und 128 GByte HBM3-Speicher, den sich CPU und GPU teilen. Die Chiplet-Künstler bei AMD stellte dies aber noch nicht zufrieden: Für eine aufgebohrte Fassung namens Instinct MI300X tauschten die Entwickler das CPU-Chiplet gegen ein viertes GPU-Chiplet aus und erhöhten die Größe des HBM3-Speichers um 50 Prozent auf 192 GByte. Mit einer Speicherbandbreite von 5,2 TByte/Sekunde und einer internen Infinity-Fabric-Bandbreite von immerhin noch 896 GByte/Sekunde überragt der MI300X Nvidias KI-System H100 faktisch gleich zweifach: Die Speicherdichte ist bis zu 2,4 Mal, die Speicherbandbreite bis zu 1,6 Mal höher.

Empfohlener redaktioneller Inhalt [EMBED_URL] An dieser Stelle finden Sie externe Inhalte von [PLATTFORM]. Zum Schutz Ihrer persönlichen Daten werden externe Einbindungen erst angezeigt, wenn Sie dies durch Klick auf "Alle externen Inhalte laden" bestätigen: Ich bin damit einverstanden, dass mir externe Inhalte angezeigt werden. Damit werden personenbezogene Daten an Drittplattformen übermittelt. Mehr dazu in unserer Datenschutzerklärung.
Externe Inhalte Mehr dazu in unserer Datenschutzerklärung.

Die 153 Milliarden Transistoren des Beschleunigers bekamen bei einer KI-Demo in San Francisco sofort etwas zu tun: Das KI-Modell Falcon 40B, das komplett in den Speicher des Systems passt, schrieb ein kurzes Gedicht über San Francisco, das sich zwar reimte, aber mit den oft desolaten Verhältnissen auf den Straßen der Stadt dann doch nicht unbedingt viel zu tun hatte. Vermutlich wurde das Modell vom Amt für Öffentlichkeitsarbeit trainiert. Spaß beiseite: Diese Demo war deswegen wichtig, weil sie das erste Mal markiert, dass das Modell im Speicher einer einzigen GPU läuft. Außerdem bringen die 40 Milliarden Parameter den Instinct MI300X noch nicht ins Schwitzen. Nach Angaben eines AMD-Mitarbeiters verkraftet der Beschleuniger sogar bis zu 80 Milliarden (!) Parameter.

Bildergalerie

ROCm gegen CUDA

So wie Nvidia beziehungsweise dessen Partner mehrere A100- oder H100-Einheiten in einem Server kombiniert, setzt auch AMD auf den mehrfachen Einsatz des Instinct MI300X. Gleich acht Stück sollen mit 1,5 TByte HBM3-Speicher nebeneinander Platz finden. Weitere Details wie der nicht ganz unwichtige Preis sind noch nicht bekannt - wohl aber, dass der Instinct MI300A schon jetzt, der Instinct MI300X ab dem dritten Quartal 2023 ausgewählten Partnern zu Tests zur Verfügung gestellt wird beziehungsweise werden soll. Im vierten Quartal soll dann die Produktion im großen Stil anlaufen. Auch zu detaillierten Benchmarks schweigt sich AMD aus. Lediglich eine Kurve, die auf der x-Achse die Zahl der KI-Parameter und auf der y-Achse die Zahl der benötigten GPUs anzeigte, signalisiert eine Halbierung der "vom Mitbewerber" benötigten GPUs mit 80 GByte RAM.

Zur Programmierung des Systems, das auf die CDNA-3-Architektur aufbaut, setzt AMD auf die bekannten Open-Software-KI-Plattformen ROCm - gesprochen "Rock 'em" - für Rechenzentren-GPUs vom Typ Instinct und Zen DNN für Rechenzentren-CPUs wie Epyc. Für Edge- und Endpunkt-Anwendungen, die auf AMDs Versal- und mobilen Ryzen-Chips laufen, kommt Vitis AI zum Einsatz. Auch etablierte KI-Modelle wie PyTorch und TensorFlow werden von AMDs Software unterstützt. Allerdings ist die Konkurrenz-Plattform CUDA von Nvidia schon seit 2007 am Start und inzwischen bereits in der Version 12.1 erhältlich - AMD muss also alles daransetzen, die eigenen KI-Beschleuniger attraktiv genug zu gestalten, damit sich Programmierer und Entwickler in eine für sie neue Plattform einarbeiten.

18
    • Kommentare (18)

      Zur Diskussion im Forum
      • Von Cleriker Kokü-Junkie (m/w)
        Ach so meinst du das. Ja, da hast du nicht unrecht.
      • Von Cleriker Kokü-Junkie (m/w)
        Ach so meinst du das. Ja, da hast du nicht unrecht.
      • Von Bärenmarke BIOS-Overclocker(in)
        Zitat von Cleriker
        Ich mag nicht ausschließen, dass ich das falsch verstanden habe, aber das Framework sagt ja nur was beispielsweise mit der Phyton-Bib (phytorch) angestellt werden soll und ROCm macht dann, dass diese Instruktionen auf in diesem Falle hier, der MI300A ausgeführt werden können.
        Irre ich mich da? Kann sein, ich hab mit Programmierung nichts am Hut, aber mir das eben genau so erklärt.
        So verstehe ich das auch, nur dominiert dann ja nicht CUDA den AI Markt, würde CUDA den AI Markt dominieren, dann müsste AMD mit ROCm das ja in CUDA übersetzen und so müssen ja beide Hersteller bzw. ja auch intel schauen wie das Framework bestmöglich genutzt wird.
      • Von Cleriker Kokü-Junkie (m/w)
        Ich mag nicht ausschließen, dass ich das falsch verstanden habe, aber das Framework sagt ja nur was beispielsweise mit der Phyton-Bib (phytorch) angestellt werden soll und ROCm macht dann, dass diese Instruktionen auf in diesem Falle hier, der MI300A ausgeführt werden können.
        Irre ich mich da? Kann sein, ich hab mit Programmierung nichts am Hut, aber mir das eben genau so erklärt.
      • Von Bärenmarke BIOS-Overclocker(in)
        Zitat von Cleriker
        Spannendes Produkt, aber sehr schwierig zu etablieren. CUDA ist einfach der aktuelle Standard und wie schon in der News steht, wird es nicht leicht gewohntes abzulegen, um sich in was neuen einzuarbeiten. Gerade letzteres stellt die größte Hürde dar.
        So wie ich das verstanden habe spielt Cuda dort gar keine Rolle, da die entsprechenden Frameworks von den Anbietern wie Meta, Microsoft, Google usw. bereitgestellt werden und dann entsprechend dein Softwarestack damit umgehen muss. Z.B. wie bei Pytorch.
      • Von Shalashaska83 PC-Selbstbauer(in)
        Sehr spannend. Da fragt man sich ia eigentlich nur, bis wann das ganze in handelsüblichen PCs/Notebooks/Konsolen einzug finden könnte? Aktuelle und auf die nächsten paar Jahre gesehen wird man sowas vermutlich noch nicht kostengünstig realisieren können. Aber in 10 Jahren z.B.? Gerade auch im Bereich Gaming hat AI ein riesen Potential. Man stelle sich nur eine OW vor, bei der Ereignisse, die komplette Umgebung etc. in Echtzeit ohne komplexe vorgegeben Standard Routinen einem ständigen Wechsel unterliegen können und wer weiß was sonst noch.
        Allein was mittlerweile schon im Bereich Bilderbearbeitung drin ist, ist beeindruckend und das ganze wird von Woche zu Woche gefühlt immer besser.
        Auch wenn eine gewisse Vorsicht bei KI sicherlich angebracht sein sollte, neben dem ganzen Guten, lässt sich damit heute schon genügend Schabernack betreiben (Deep Fake, Stimmenimitation etc.)
        Dennoch, wie gesagt, ein wirklich spannendes Thema das mich an Fortschritte erinnert, die es schon lange in diesem Ausmaß im IT Bereich nicht mehr gab.
      Direkt zum Diskussionsende
  • Print / Abo
    Apps
    PCGH Magazin 07/2026 PC Games 06/2026 play5 07/2026 N-Zone 06/2026 Linux Magazin 07/2026 LinuxUser 07/2026 Raspberry Pi Geek 07/2026
    PC Games Hardware PC Games Linux Magazin Raspberry Pi Geek Computec Kiosk