China schlägt zurück: Supercomputer erreicht 2 ExaFLOPS ganz ohne Nvidia-GPUs
Die USA wollten Chinas KI-Aufstieg ausbremsen, doch Peking schlägt zurück: Mit dem Supercomputer LineShine und 2,4 Millionen Prozessorkernen von Huawei knackt das National Supercomputing Center die magische ExaFLOPS-Marke gleich doppelt.
Mit dem Supercomputer Lingsheng (灵晟, auch als "LineShine" bekannt) setzt das National Supercomputing Center in Shenzhen ("NSCC-SZ") jetzt ein nachdrückliches Ausrufezeichen im KI-Wettrüsten zwischen den Vereinigten Staaten von Amerika und der Volksrepublik China. Wie aus Berichten von HPCwire und Tom's Hardware sowie einer offiziellen Mitteilung des NSCC-SZ hervorgeht, durchbricht das chinesische System die magische "ExaFLOPS-Marke" gleich doppelt.
Supercomputer erreicht 2 ExaFLOPS ganz ohne GPUs
Ganz ohne GPUs von Nvidia, AMD oder Intel: Ein begleitendes Forschungspapier attestiert Lingsheng alias "LineShine" eine konsistente Leistung von 1,54 ExaFLOPS ("BF16") mit Peaks von 2,16 ExaFLOPS beim Training eines riesigen KI-Modells mit insgesamt 6,3 Milliarden Parametern. Lu Yutong, Direktor des NSCC-SZ, spricht selbstbewusst von "vollständiger Souveränität und Kontrolle".
47.000 ARM-Prozessoren in zwei Ausbaustufen
Das Herzstück von Lingsheng bildet der eigens für HPC- und KI-Workloads entwickelte "LX2-Prozessor", den Jon Peddie Research dem chinesischen Tech-Riesen Huawei zuschreibt. Jede der 40.960 verbauten CPUs setzt auf zwei Compute-Chiplets mit insgesamt 304 ARMv9-Kernen, organisiert in acht Clustern zu je 38 Kernen.
- Über die beiden bekannten Arm-Erweiterungen SVE ("Scalable Vector Extension") und SME ("Scalable Matrix Extension") beschleunigt der Prozessor die Vektor- und Matrix-Operationen in FP64, FP32, BF16, FP16 und INT8, ein einzelner LX2 liefert dabei 60,3 TFLOPS in FP64 und 240 TFLOPS in BF16/FP16.
- Pro Sockel stehen 32 GiB HBM (4 TB/s) plus 256 GiB DDR5 bereit, vernetzt über das hauseigene LingQi-Netzwerk mit 1,6 Tb/s pro Knoten. Der Aufbau erfolgt offiziell in zwei Stufen:
- Auf eine Pilotphase mit 100 Huawei-Kunpeng-Servern und 12.800 Prozessorkernen folgt die Vollausbaustufe mit 47.000 CPUs in 92 Compute-Schränken, 650 Petabyte Storage und 10 TB/s Bandbreite.
Made in China: El Capitan im Visier
Strategisch ist Lingsheng ein Statement: Chips, Speicher, Interconnect, Storage und sogar das Betriebssystem (Anolis OS 8.9) stammen vollständig aus einer heimischen Fertigung. Bereits Ende 2025 bestätigte der stellvertretende NSCC-Direktor Huang Xiaohui eine "Spitzenleistung von 2 ExaFLOPS" - damit rückt das CPU-Monster in Schlagdistanz zum AMD-basierten El Capitan mit 1,74 ExaFLOPS ("Rmax") am Lawrence Livermore National Laboratory. Eine echte Kampfansage Chinas.
Bei der Effizienz hinter westlichen Systemen
Doch der Trumpf hat einen Haken: CPU-only-Systeme sind in aller Regel weniger energieeffizient und liefern eine geringere dichte KI-Rechenleistung als heterogene CPU+GPU-Architekturen - nicht ohne Grund setzen Marktführer wie xAI, OpenAI und Meta weiterhin auf hunderttausende Nvidia-Beschleuniger. Trotzdem zeigt Lingsheng eindrucksvoll, dass Pekings Streben nach digitaler Eigenständigkeit längst nicht mehr nur Theorie, sondern Wirklichkeit ist. Der Supercomputer aus China liest sich wie eine Unabhängigkeitserklärung an die USA und deren Big-Tech-Unternehmen.
Ihre Meinung ist gefragt!
Wie stehen Sie zu diesem Thema? Die PCGH-Redaktion freut sich über Ihre fundierte Meinung in den Kommentaren zu dieser Meldung. Um zu kommentieren, müssen Sie auf PCGH.de oder im Extreme-Forum eingeloggt sein. Sollten Sie bisher noch keinen Account haben, können Sie sich hier unverbindlich registrieren. Beachten Sie beim Kommentieren aber bitte die geltenden Forenregeln.
Quelle: NSCC-SZ via HPC Wire / Tom's Hardware / Jon Peddie Research / Cornell University

Erklärt aber auch wieso in China Atomkraftwerke wie Pilze aus dem Boden wachsen, wenn China etwas hat, dann viel Energie.