Chinas erste Cloud-GPU: "Big Island" ist bei TSMC in der 7-nm-Massenfertigung

23
News Valentin Sattler Als bevorzugte Quelle auf Google hinzufügen
Chinas erste Cloud-GPU: "Big Island" ist bei TSMC in der 7-nm-Massenfertigung
Quelle: Iluvatar

Die von Shanghai Tianshu Zhixin Semiconductor entwickelte Compute-GPU "Big Island" ist offenbar bei TSMC in der Massenfertigung angelangt. Im Vergleich zu den Konkurrenzprodukten AMD Instinct MI100 und Nvidia A100 fällt insbesondere die niedrige Transistorzahl auf.

China versucht schon seit vielen Jahren, zunehmend mehr Hardware im eigenen Land zu entwickeln und zu produzieren, um sich somit von anderen Ländern unabhängiger zu machen. Beispiele dafür sind massive Investitionen in die Speicherproduktion, die x86-Prozessoren von Zhaoxin und eine neue Compute-GPU: Die von Shanghai Tianshu Zhixin Semiconductor produzierte Big Island.

Big Island gegen MI100 und A100

Im Januar wurde Big Island überraschend angekündigt, doch die Entwicklung der Compute-GPU soll schon 2018 begonnen haben. In diesem Zeitraum wurde eine GPU entwickelt, die es zumindest auf dem Papier in sich hat. Der Chip mit seinen 24 Milliarden Transistoren soll neben 32 GB HBM2 auf einem Interposer untergebracht werden und diverse Rechenarten wie beispielsweise FP16, INT16 und INT8 unterstützen. Konkurrenten dürften somit AMDs Instinct MI100 ("Arcturus") und die Nvidia A100 sein. Big Island soll auf dem Papier viel Leistung bieten. Ob diese am Ende wirklich so abrufbar wird, dürfte am Ende auch von der Software abhängen. Quelle: Iluvatar Big Island soll auf dem Papier viel Leistung bieten. Ob diese am Ende wirklich so abrufbar wird, dürfte am Ende auch von der Software abhängen. Big Island soll eine TDP von 300 W haben und GPU sowie Speicher <a href='www.pcgameshardware.de/Neue-Technologien-Thema-71240/News/TSMC-stellt-zweite-Generation-Interposer-mit-1700-mm-vor-1344669/'>auf einem CoWoS-Interposer</a> unterbringen. Quelle: Iluvatar Big Island soll eine TDP von 300 W haben und GPU sowie Speicher auf einem CoWoS-Interposer unterbringen. Während im Januar nur die Rede davon war, dass "Big Island" in der Testphase sei, so wurde die GPU nun offiziell vorgestellt. Demnach befindet sie sich aktuell in der Massenfertigung bei TSMC. Dort setzt sie, wie die Compute-Konkurrenz von AMD und Nvidia, auf den 7-nm-Prozess.

Auch interessant: Radeon RX 6900 XT OCF: Neues Topmodell von Asrock gesichtet

Mit Hinblick auf die Leistung ist ein Vergleich schwer, denn die Grafikkarten von Thianshu Zhixin, AMD und Nvidia decken unterschiedliche Zielgruppen ab und unterstützen somit unterschiedliche Rechenformate. Vergleichswerte gibt es nur für FP32-, FP16- und INT8-Operationen. Hier liegt Big Island durchweg vor AMDs mehr als doppelt so großer MI100-GPU, wohingegen die Nvidia A100 nur in FP32-Berechnungen bezwungen wird.

GPU Big Island AMD MI100 Nvidia A100
Fertigung 7nm, TSMC 7nm, TSMC 7nm, TSMC
Transistoren 24 Milliarden 50 Milliarden 54 Milliarden
Speicher 32 GB HBM2 32 GB HBM2 40 GB / 80 GB HBM2
TDP 300 W 300 W 250 W / 400 W
FP32 37 TFLOPs 23,1 TFLOPs 19,5 TFLOPs
FP16 147 TFLOPs 92,3 TFLOPs 312 TFLOPs
INT8 295 TOPs 184,6 TOPs 624 TOPs

Nachdem alle drei GPUs auf denselben Prozess setzen, dürften die tatsächlichen Unterschiede aber geringer ausfallen: Je nach Verteilung der Recheneinheiten dürften abwechselnd Tianshu Zhixin, AMD und Nvidia vorne liegen. Nvidia hat dabei den Vorteil eines größeren TDP-Spielraums, wohingegen die Big-Island-GPU mit nur 24 Milliarden Transistoren vermutlich weniger Rechenformate oder Operationen unterstützen wird.

Quelle: Iluvatar via Videocardz

23
    • Kommentare (23)

      Zur Diskussion im Forum
      • Von PCGH_Torsten Kokü-Junkie (m/w)
        Das präzise Anzeigen (=fp32 heutzutage) eines Bildes hat mit der groben Erkennung von Inhalten desselben nichts zu tun.
      • Von PCGH_Torsten Kokü-Junkie (m/w)
        Das präzise Anzeigen (=fp32 heutzutage) eines Bildes hat mit der groben Erkennung von Inhalten desselben nichts zu tun.
      • Von Nebulus07
        Zitat von PCGH_Torsten
        Die Art der Berechnungen hat nichts mit der benötigten Genaugikeit zu tun, letztere resultiert aus dem Zweck. Und gerade KI-Training stellt da sehr geringe Anforderungen und ist die treibende Kraft hinter dem Fokus auf FP16 und kleiner in den letzten Jahren, einschließlich neuer Formate, während noch vor 5-10 Jahren eher Double-Precission für wissenschaftliche Berechnungen im Fokus stand. Aber da KI in der Praxis weiterhin eher KD ist, bringen hohe Genauigkeiten nichts. Warum sollte man bis in die zehnte statt bis in die fünfte Dezimalstelle mathematisch exakt rechnen, wenn der zugrunde liegende Algorithmus sowieso eine Fehleranfälligkeit von deutlich über ein Prozent hat, also nicht einmal bis in die dritte Stelle verlässlich arbeitet? Erst einmal muss die KI selbst mittels einer breiteren Datengrundlage verbessert werden und dafür braucht es Durchsatz, nicht Präzision. Der neue Trend ist BF16.
        Wenn ich mir den Quellcode zum Anzeigen eines 3D Gesichtes mit Texture anschaue, wird hauptsächlich nur mit float Matrizen gerechnet. Float = fp32.

        Integerleistung wird nur zum abarbeiten von Listen oder Speichererung von Mustern benutzt.
        Somit ist die China GPU, mit ihrer sehr guten fp32 Leistung, für ihren Einsatz als 3D-Texture Erkennung, geeignet.

        Zum Berechnen von Hashsummen wie bei Cryptocurrency, benötigt man auch eher int Leistung.

        [Ins Forum, um diesen Inhalt zu sehen]
      • Von PCGH_Torsten Kokü-Junkie (m/w)
        Zitat von Nebulus07
        Ich denke mal für die AI Berechnungen ist die FP32 Leistung wichtig, da dort Matrizen berechnet werden und Vectoren. Da in China die Nachfrage nach AI GPUs unendlich hoch ist, wird sich jetzt NVIDIA die bisher hauptsächlich bezogen wurden, ganz schön in den Popo beißen.
        Die Art der Berechnungen hat nichts mit der benötigten Genaugikeit zu tun, letztere resultiert aus dem Zweck. Und gerade KI-Training stellt da sehr geringe Anforderungen und ist die treibende Kraft hinter dem Fokus auf FP16 und kleiner in den letzten Jahren, einschließlich neuer Formate, während noch vor 5-10 Jahren eher Double-Precission für wissenschaftliche Berechnungen im Fokus stand. Aber da KI in der Praxis weiterhin eher KD ist, bringen hohe Genauigkeiten nichts. Warum sollte man bis in die zehnte statt bis in die fünfte Dezimalstelle mathematisch exakt rechnen, wenn der zugrunde liegende Algorithmus sowieso eine Fehleranfälligkeit von deutlich über ein Prozent hat, also nicht einmal bis in die dritte Stelle verlässlich arbeitet? Erst einmal muss die KI selbst mittels einer breiteren Datengrundlage verbessert werden und dafür braucht es Durchsatz, nicht Präzision. Der neue Trend ist BF16.
      • Von Basileukum Software-Overclocker(in)
        Ist natürlich Kindergarten, die Fertigung muß auch auf dem chinesischen Festland stattfinden. Das muß von der Ressourcenbeschaffung bis zum Endprodukt laufen. Alles andere ist inaktzeptabel. Damit da kein internationales Geschmeiß seine Hand auf der Fertigung bzw. anderem drauf hat.

        Ist ja bei uns Deutschen bzw. erweitert den Europäern auch nicht anders. Frei nach dem Motto: "Jedes Wesen soll an seinem eigenen genesen". Ob jetzt in Asien, Afrika, Europa oder sonstwo.
      • Von Nebulus07
        Zitat von BlubberLord
        Die auf Machine Learning (= "AI") ausgelegten GPUs von nVidia haben besonders hohe INT-Leistung. Nicht zuletzt wurde in den letzten beiden Architekturen mit den Tensor-Einheiten auch Chipfläche für spezialisierte "Fixed Purpose"-Kerne aufgewendet.

        Klar ist es bei AI-Workloads ein Unterschied ob es um das Inferencing oder das spätere Matching geht – FP32-Power deutet meiner Meinung nach aber eher auf wissenschaftliche Compute-Anwendungen hin, die nicht große statische Matrizen auf einzelne Werte anwenden sondern komplett mit "zufälligen" Zahlen und hoher Genauigkeit rechnen müssen.
        Ich denke für Morphing von Bitmaps braucht man fp32 Leistung. Mit int16/8 kommt man da nicht weiter. Ich kenne mich in der AI Bilderkennung aber nicht gut aus...
      Direkt zum Diskussionsende
  • Print / Abo
    Apps
    PCGH Magazin 08/2026 PC Games 07/2026 play5 08/2026 N-Zone 07/2026 Linux Magazin 07/2026 LinuxUser 07/2026 Raspberry Pi Geek 07/2026
    PC Games Hardware PC Games Linux Magazin Raspberry Pi Geek Computec Kiosk