AMD Instinct MI300X: KI-Sprachmodellbeschleuniger mit 750 W TDP

5
News Alexander Pensler Als bevorzugte Quelle auf Google hinzufügen
AMD Instinct MI300X: KI-Sprachmodellbeschleuniger mit 750 W TDP
Quelle: AMD

AMDs Instinct MI300X ist ein KI-Beschleuniger für Sprachmodelle mit einer TDP von 750 W, wie das Kleingedruckte einer AMD-Pressemitteilung kürzlich verriet. Die Markteinführung ist für das dritte Quartal 2023 geplant.

AMD bläst nun offenbar zur Großoffensive gegen Nvidia im Bereich der KI-Beschleuniger: Erst im Januar hatte AMD den Instinct MI300A vorgestellt, der auf Zen-4-Kernen und CDNA-3-GPU basiert. Auf einem AMD-Event in San Francisco präsentierte CEO Dr. Lisa Su den Instinct MI300X, der ausschließlich auf CDNA-3-Grafikkernen basiert. Erst jetzt fiel im Kleingedruckten einer AMD-Pressemitteilung die Thermal Design Power (TDP) auf: Demnach wird der MI300X eine TDP von 750W haben.

Bislang höchste TDP im Bereich der KI-Beschleuniger

Der MI300X tauscht die insgesamt 24 Zen-4-CPU-Kerne des MI300A gegen weitere CDNA-3-Grafikeinheiten aus und besitzt mit 192 GiB auch mehr HBM3- Speicher. Kein anderer KI-Beschleuniger für "Large Language"-Modelle wie ChatGTP, Google Bard und Bing hat zudem eine höhere TDP: AMD gibt für den MI300X besagte 750 W TDP an, die Vorgängergeneration MI250X auf CDNA-2-Basis kam stattdessen nur auf 560 W.

Auch die Mitbewerber geben für ihre KI-Beschleuniger niedrigere Leistungswerte an. Nvidias H100 SXM-Grafikeinheit kommt auf 700 W TDP und liegt damit laut Datenblatt nur knapp hinter AMDs Neuzugang. Die "Intel Max 1550"-Grafikeinheit liegt mit 600 W TDP noch etwas weiter hinter den KI-Beschleunigern von AMD und Nvidia.

MI300X und MI300A im Vergleich

Der neu vorgestellte Instinct MI300X besitzt keine CPU-Kerne, während ein MI300A drei 8-Kern-CCDs enthält und somit auf insgesamt 24 Zen-4-Kerne kommt. Beim MI300X werden die drei CPU-Kerne durch zwei GPU-Einheiten ersetzt, so dass ein MI3000X über 8 statt 6 GPU-Einheiten verfügt. Statt der 128 GiB HBM3-Speicher des MI300A setzt AMD bei gleicher Speicherbandbreite von 5,2 TB/s auf 192 GiB HBM3-Speicher. Die Anzahl der Transistoren steigt beim MI300X von 146 Milliarden auf 153 Milliarden.

Quelle: AMD Pressemitteilung (via Tomshardware)

5
    • Kommentare (5)

      Zur Diskussion im Forum
      • Von Expertenstatement PC-Selbstbauer(in)
        Einfach nur beeindrucken was AMD hier wieder für ein Hochleistungsprodukt auf die Beine gestellt hat.
      • Von Expertenstatement PC-Selbstbauer(in)
        Einfach nur beeindrucken was AMD hier wieder für ein Hochleistungsprodukt auf die Beine gestellt hat.
      • Von Shinna Lötkolbengott/-göttin
        AMDs Fokus liegt beim MI300(X) ein Stück weit in der Zukunft. Da wird Richtung Zetta-Scaling geschaut. Wenn man von Exxa-Scale auf Zetta-Scale kommen möchte gibt es nämlich ein gravierendes Problem: Der Energieverbrauch.

        Das Problem ist nicht mal der derzeitige Performancegewinn. Aktuell verdoppelt sich ungefähr alle 2,2 Jahre die Effizienz eines Supercomputers. Möchte man Mitte der 2030iger einen Zetta-Scale System bauen wäre das mit Hardware, basierend auf aktuellen Entwicklungen, kaum möglich. Ein entsprechender Rechner würde basierend auf der aktuellen Entwicklung ca. die Hälfte an Leistung eines kleinen AKWs benötigen. Ein gutes Video zum MI300 bietet High Yield mit seinem Deep Dive.

        [Ins Forum, um diesen Inhalt zu sehen]
      • Von DoctorChandra
        Was die Anderen können, kann AMD auch.
      • Von Turbo1993 Freizeitschrauber(in)
        Zitat von Schori
        Die 700W TDP an sich klingen erstmal nach viel aus aber man muss das in Relation zur gebotenen Leistung sehen.
        Weiß da jemand mehr?
        Im Bereich von HPC muss man TDP anders bewerten. Wenn man HPC kauft, dann gibt mal als Zielstellung die Gesamt-Performance des Systems an, z.B. 1 EFlop/s. Dann liegt es beim Hersteller, wie die erreicht wird. Das kann mit wenigen Leistungsstarken und vielen Leistungsschwachen Knoten passieren. Allerdings entstehen dadurch neue Faktoren, die der potenzielle Käufer auch betrachtet, wie der Gesamtverbrauch des Systems. Und es hat sich herausgestellt, das Daten transportieren mit Abstand der energieintensivste Prozess im HPC ist, weshalb man die Daten möglichst in einen Knoten halten will. Dadurch müssen die Knoten Leistungsfähiger werden und brauchen mehr Strom. Dafür kann man die Anzahl an Knoten reduzieren und der HPC wird insgesamt Effizenter.

        Was ich allerdings als Marketing abtun würde ist, dass der vorrangig MI300X ein KI-Beschleuniger ist. Das kann der Zwar auch beschleunigen, aber Nvidia konzentriert sich hier viel mehr darauf. Dagegen hat AMD mehr die klassischen Simulation im Blick, wo viel 64 Bit Gleitkomma-Operationen notwendig. Genau das, was wir z.B. brauchen.
      • Von Schori Volt-Modder(in)
        Die 700W TDP an sich klingen erstmal nach viel aus aber man muss das in Relation zur gebotenen Leistung sehen.
        Weiß da jemand mehr?
      Direkt zum Diskussionsende
  • Print / Abo
    Apps
    PCGH Magazin 07/2026 PC Games 06/2026 play5 07/2026 N-Zone 06/2026 Linux Magazin 06/2026 LinuxUser 06/2026 Raspberry Pi Geek 07/2026
    PC Games Hardware PC Games Linux Magazin Raspberry Pi Geek Computec Kiosk