Chinas erste Cloud-GPU: "Big Island" ist bei TSMC in der 7-nm-Massenfertigung

News 04.04.2021 um 11:00 Uhr Valentin Sattler Als bevorzugte Quelle auf Google hinzufügen

Die von Shanghai Tianshu Zhixin Semiconductor entwickelte Compute-GPU "Big Island" ist offenbar bei TSMC in der Massenfertigung angelangt. Im Vergleich zu den Konkurrenzprodukten AMD Instinct MI100 und Nvidia A100 fällt insbesondere die niedrige Transistorzahl auf.

China versucht schon seit vielen Jahren, zunehmend mehr Hardware im eigenen Land zu entwickeln und zu produzieren, um sich somit von anderen Ländern unabhängiger zu machen. Beispiele dafür sind massive Investitionen in die Speicherproduktion, die x86-Prozessoren von Zhaoxin und eine neue Compute-GPU: Die von Shanghai Tianshu Zhixin Semiconductor produzierte Big Island.

Big Island gegen MI100 und A100

Im Januar wurde Big Island überraschend angekündigt, doch die Entwicklung der Compute-GPU soll schon 2018 begonnen haben. In diesem Zeitraum wurde eine GPU entwickelt, die es zumindest auf dem Papier in sich hat. Der Chip mit seinen 24 Milliarden Transistoren soll neben 32 GB HBM2 auf einem Interposer untergebracht werden und diverse Rechenarten wie beispielsweise FP16, INT16 und INT8 unterstützen. Konkurrenten dürften somit AMDs Instinct MI100 ("Arcturus") und die Nvidia A100 sein. Quelle: Iluvatar Big Island soll auf dem Papier viel Leistung bieten. Ob diese am Ende wirklich so abrufbar wird, dürfte am Ende auch von der Software abhängen. Quelle: Iluvatar Big Island soll eine TDP von 300 W haben und GPU sowie Speicher auf einem CoWoS-Interposer unterbringen. Während im Januar nur die Rede davon war, dass "Big Island" in der Testphase sei, so wurde die GPU nun offiziell vorgestellt. Demnach befindet sie sich aktuell in der Massenfertigung bei TSMC. Dort setzt sie, wie die Compute-Konkurrenz von AMD und Nvidia, auf den 7-nm-Prozess.

Auch interessant: Radeon RX 6900 XT OCF: Neues Topmodell von Asrock gesichtet

Mit Hinblick auf die Leistung ist ein Vergleich schwer, denn die Grafikkarten von Thianshu Zhixin, AMD und Nvidia decken unterschiedliche Zielgruppen ab und unterstützen somit unterschiedliche Rechenformate. Vergleichswerte gibt es nur für FP32-, FP16- und INT8-Operationen. Hier liegt Big Island durchweg vor AMDs mehr als doppelt so großer MI100-GPU, wohingegen die Nvidia A100 nur in FP32-Berechnungen bezwungen wird.

GPU	Big Island	AMD MI100	Nvidia A100
Fertigung	7nm, TSMC	7nm, TSMC	7nm, TSMC
Transistoren	24 Milliarden	50 Milliarden	54 Milliarden
Speicher	32 GB HBM2	32 GB HBM2	40 GB / 80 GB HBM2
TDP	300 W	300 W	250 W / 400 W
FP32	37 TFLOPs	23,1 TFLOPs	19,5 TFLOPs
FP16	147 TFLOPs	92,3 TFLOPs	312 TFLOPs
INT8	295 TOPs	184,6 TOPs	624 TOPs

Nachdem alle drei GPUs auf denselben Prozess setzen, dürften die tatsächlichen Unterschiede aber geringer ausfallen: Je nach Verteilung der Recheneinheiten dürften abwechselnd Tianshu Zhixin, AMD und Nvidia vorne liegen. Nvidia hat dabei den Vorteil eines größeren TDP-Spielraums, wohingegen die Big-Island-GPU mit nur 24 Milliarden Transistoren vermutlich weniger Rechenformate oder Operationen unterstützen wird.

Quelle: Iluvatar via Videocardz

Artikel teilen

Chinas erste Cloud-GPU: "Big Island" ist bei TSMC in der 7-nm-Massenfertigung Die von Shanghai Tianshu Zhixin Semiconductor entwickelte Compute-GPU "Big Island" ist offenbar bei TSMC in der Massenfertigung angelangt. Im Vergleich zu den Konkurrenzprodukten AMD Instinct MI100 und Nvidia A100 fällt insbesondere die niedrige Transistorzahl auf.

Per E-Mail versenden

- Kommentare (23)
  Zur Diskussion im Forum
  
  Von PCGH_Torsten Kokü-Junkie (m/w)
  
  Das präzise Anzeigen (=fp32 heutzutage) eines Bildes hat mit der groben Erkennung von Inhalten desselben nichts zu tun.
  
  Zitieren
  
  Von PCGH_Torsten Kokü-Junkie (m/w)
  
  Das präzise Anzeigen (=fp32 heutzutage) eines Bildes hat mit der groben Erkennung von Inhalten desselben nichts zu tun.
  
  Zitieren
  
  Von Nebulus07
  
  Zitat von PCGH_Torsten
  
  Die Art der Berechnungen hat nichts mit der benötigten Genaugikeit zu tun, letztere resultiert aus dem Zweck. Und gerade KI-Training stellt da sehr geringe Anforderungen und ist die treibende Kraft hinter dem Fokus auf FP16 und kleiner in den letzten Jahren, einschließlich neuer Formate, während noch vor 5-10 Jahren eher Double-Precission für wissenschaftliche Berechnungen im Fokus stand. Aber da KI in der Praxis weiterhin eher KD ist, bringen hohe Genauigkeiten nichts. Warum sollte man bis in die zehnte statt bis in die fünfte Dezimalstelle mathematisch exakt rechnen, wenn der zugrunde liegende Algorithmus sowieso eine Fehleranfälligkeit von deutlich über ein Prozent hat, also nicht einmal bis in die dritte Stelle verlässlich arbeitet? Erst einmal muss die KI selbst mittels einer breiteren Datengrundlage verbessert werden und dafür braucht es Durchsatz, nicht Präzision. Der neue Trend ist BF16.
  
  Wenn ich mir den Quellcode zum Anzeigen eines 3D Gesichtes mit Texture anschaue, wird hauptsächlich nur mit float Matrizen gerechnet. Float = fp32.
  
  Integerleistung wird nur zum abarbeiten von Listen oder Speichererung von Mustern benutzt.
  Somit ist die China GPU, mit ihrer sehr guten fp32 Leistung, für ihren Einsatz als 3D-Texture Erkennung, geeignet.
  
  Zum Berechnen von Hashsummen wie bei Cryptocurrency, benötigt man auch eher int Leistung.
  
  [Ins Forum, um diesen Inhalt zu sehen]
  
  Zitieren
  
  Von PCGH_Torsten Kokü-Junkie (m/w)
  
  Zitat von Nebulus07
  
  Ich denke mal für die AI Berechnungen ist die FP32 Leistung wichtig, da dort Matrizen berechnet werden und Vectoren. Da in China die Nachfrage nach AI GPUs unendlich hoch ist, wird sich jetzt NVIDIA die bisher hauptsächlich bezogen wurden, ganz schön in den Popo beißen.
  
  Die Art der Berechnungen hat nichts mit der benötigten Genaugikeit zu tun, letztere resultiert aus dem Zweck. Und gerade KI-Training stellt da sehr geringe Anforderungen und ist die treibende Kraft hinter dem Fokus auf FP16 und kleiner in den letzten Jahren, einschließlich neuer Formate, während noch vor 5-10 Jahren eher Double-Precission für wissenschaftliche Berechnungen im Fokus stand. Aber da KI in der Praxis weiterhin eher KD ist, bringen hohe Genauigkeiten nichts. Warum sollte man bis in die zehnte statt bis in die fünfte Dezimalstelle mathematisch exakt rechnen, wenn der zugrunde liegende Algorithmus sowieso eine Fehleranfälligkeit von deutlich über ein Prozent hat, also nicht einmal bis in die dritte Stelle verlässlich arbeitet? Erst einmal muss die KI selbst mittels einer breiteren Datengrundlage verbessert werden und dafür braucht es Durchsatz, nicht Präzision. Der neue Trend ist BF16.
  
  Zitieren
  
  Von Basileukum Software-Overclocker(in)
  
  Ist natürlich Kindergarten, die Fertigung muß auch auf dem chinesischen Festland stattfinden. Das muß von der Ressourcenbeschaffung bis zum Endprodukt laufen. Alles andere ist inaktzeptabel. Damit da kein internationales Geschmeiß seine Hand auf der Fertigung bzw. anderem drauf hat.
  
  Ist ja bei uns Deutschen bzw. erweitert den Europäern auch nicht anders. Frei nach dem Motto: "Jedes Wesen soll an seinem eigenen genesen". Ob jetzt in Asien, Afrika, Europa oder sonstwo.
  
  Zitieren
  
  Von Nebulus07
  
  Zitat von BlubberLord
  
  Die auf Machine Learning (= "AI") ausgelegten GPUs von nVidia haben besonders hohe INT-Leistung. Nicht zuletzt wurde in den letzten beiden Architekturen mit den Tensor-Einheiten auch Chipfläche für spezialisierte "Fixed Purpose"-Kerne aufgewendet.
  
  Klar ist es bei AI-Workloads ein Unterschied ob es um das Inferencing oder das spätere Matching geht – FP32-Power deutet meiner Meinung nach aber eher auf wissenschaftliche Compute-Anwendungen hin, die nicht große statische Matrizen auf einzelne Werte anwenden sondern komplett mit "zufälligen" Zahlen und hoher Genauigkeit rechnen müssen.
  
  Ich denke für Morphing von Bitmaps braucht man fp32 Leistung. Mit int16/8 kommt man da nicht weiter. Ich kenne mich in der AI Bilderkennung aber nicht gut aus...
  
  Zitieren
  
  Direkt zum Diskussionsende

Hoch

Print / Abo

Apps

Die Redaktion Datenschutz Artikel-Archiv Datenschutz-Optionen Mediadaten Impressum Utiq verwalten Abo kündigen Vertrag widerrufen AGB Inhalt melden Newsletter

Big Island gegen MI100 und A100

Artikel teilen

Kommentare (23)