China schlägt zurück: Supercomputer erreicht 2 ExaFLOPS ganz ohne Nvidia-GPUs

7
News Sven Bauduin Als bevorzugte Quelle auf Google hinzufügen
China schlägt zurück: Supercomputer erreicht 2 ExaFLOPS ganz ohne Nvidia-GPUs
Quelle: Nvidia / Montage: Sven Bauduin

Die USA wollten Chinas KI-Aufstieg ausbremsen, doch Peking schlägt zurück: Mit dem Supercomputer LineShine und 2,4 Millionen Prozessorkernen von Huawei knackt das National Supercomputing Center die magische ExaFLOPS-Marke gleich doppelt.

Mit dem Supercomputer Lingsheng (灵晟, auch als "LineShine" bekannt) setzt das National Supercomputing Center in Shenzhen ("NSCC-SZ") jetzt ein nachdrückliches Ausrufezeichen im KI-Wettrüsten zwischen den Vereinigten Staaten von Amerika und der Volksrepublik China. Wie aus Berichten von HPCwire und Tom's Hardware sowie einer offiziellen Mitteilung des NSCC-SZ hervorgeht, durchbricht das chinesische System die magische "ExaFLOPS-Marke" gleich doppelt.

Supercomputer erreicht 2 ExaFLOPS ganz ohne GPUs

Ganz ohne GPUs von Nvidia, AMD oder Intel: Ein begleitendes Forschungspapier attestiert Lingsheng alias "LineShine" eine konsistente Leistung von 1,54 ExaFLOPS ("BF16") mit Peaks von 2,16 ExaFLOPS beim Training eines riesigen KI-Modells mit insgesamt 6,3 Milliarden Parametern. Lu Yutong, Direktor des NSCC-SZ, spricht selbstbewusst von "vollständiger Souveränität und Kontrolle".

47.000 ARM-Prozessoren in zwei Ausbaustufen

Das Herzstück von Lingsheng bildet der eigens für HPC- und KI-Workloads entwickelte "LX2-Prozessor", den Jon Peddie Research dem chinesischen Tech-Riesen Huawei zuschreibt. Jede der 40.960 verbauten CPUs setzt auf zwei Compute-Chiplets mit insgesamt 304 ARMv9-Kernen, organisiert in acht Clustern zu je 38 Kernen.

  • Über die beiden bekannten Arm-Erweiterungen SVE ("Scalable Vector Extension") und SME ("Scalable Matrix Extension") beschleunigt der Prozessor die Vektor- und Matrix-Operationen in FP64, FP32, BF16, FP16 und INT8, ein einzelner LX2 liefert dabei 60,3 TFLOPS in FP64 und 240 TFLOPS in BF16/FP16.
  • Pro Sockel stehen 32 GiB HBM (4 TB/s) plus 256 GiB DDR5 bereit, vernetzt über das hauseigene LingQi-Netzwerk mit 1,6 Tb/s pro Knoten. Der Aufbau erfolgt offiziell in zwei Stufen:
    • Auf eine Pilotphase mit 100 Huawei-Kunpeng-Servern und 12.800 Prozessorkernen folgt die Vollausbaustufe mit 47.000 CPUs in 92 Compute-Schränken, 650 Petabyte Storage und 10 TB/s Bandbreite.

Made in China: El Capitan im Visier

Strategisch ist Lingsheng ein Statement: Chips, Speicher, Interconnect, Storage und sogar das Betriebssystem (Anolis OS 8.9) stammen vollständig aus einer heimischen Fertigung. Bereits Ende 2025 bestätigte der stellvertretende NSCC-Direktor Huang Xiaohui eine "Spitzenleistung von 2 ExaFLOPS" - damit rückt das CPU-Monster in Schlagdistanz zum AMD-basierten El Capitan mit 1,74 ExaFLOPS ("Rmax") am Lawrence Livermore National Laboratory. Eine echte Kampfansage Chinas.

Bei der Effizienz hinter westlichen Systemen

Doch der Trumpf hat einen Haken: CPU-only-Systeme sind in aller Regel weniger energieeffizient und liefern eine geringere dichte KI-Rechenleistung als heterogene CPU+GPU-Architekturen - nicht ohne Grund setzen Marktführer wie xAI, OpenAI und Meta weiterhin auf hunderttausende Nvidia-Beschleuniger. Trotzdem zeigt Lingsheng eindrucksvoll, dass Pekings Streben nach digitaler Eigenständigkeit längst nicht mehr nur Theorie, sondern Wirklichkeit ist. Der Supercomputer aus China liest sich wie eine Unabhängigkeitserklärung an die USA und deren Big-Tech-Unternehmen.

Ihre Meinung ist gefragt!

Wie stehen Sie zu diesem Thema? Die PCGH-Redaktion freut sich über Ihre fundierte Meinung in den Kommentaren zu dieser Meldung. Um zu kommentieren, müssen Sie auf PCGH.de oder im Extreme-Forum eingeloggt sein. Sollten Sie bisher noch keinen Account haben, können Sie sich hier unverbindlich registrieren. Beachten Sie beim Kommentieren aber bitte die geltenden Forenregeln.

Quelle: NSCC-SZ via HPC Wire / Tom's Hardware / Jon Peddie Research / Cornell University

7
    • Kommentare (7)

      Zur Diskussion im Forum
      • Von hotfirefox BIOS-Overclocker(in)
        China macht das, was Europa bzw. die EU auch tun sollte...
      • Von hotfirefox BIOS-Overclocker(in)
        China macht das, was Europa bzw. die EU auch tun sollte...
      • Von Idefix Windhund BIOS-Overclocker(in)
        Eigentlich ja fast schon lustig ... USA so "Ätschibätsch, 1 ExaFLOPS" und China nur so "Hold my beer!"

        Erklärt aber auch wieso in China Atomkraftwerke wie Pilze aus dem Boden wachsen, wenn China etwas hat, dann viel Energie.
      • Von Oppenheimer Software-Overclocker(in)
        Zitat von VesperLin
        Warum denn beängstigend..? Verstehe ich nicht. Zum Thema: Ja, cool und zu erwarten. Effizienz ist da nicht wirklich wichtig, weil die da Strom im Überfluss haben. Die produzieren so viel Strom wie Europa, USA und Indien zusammen.
        Genau deswegen !!
      • Von joecnstr Freizeitschrauber(in)
        Pffft 2,16 ExaFLOPS kann ja jeder sagen! Ich warte auf die PCGH Benchmarks
      • Von Andreas1975 Volt-Modder(in)
        Läuft für die Chinesen täte ich mal sagen. Die erste Windows zertifizierte GPU ist nun ja auch am Start. Noch wenige Jahre und die haben auch ne GPU welche für KI optimiert ist.
      Direkt zum Diskussionsende
  • Print / Abo
    Apps
    PCGH Magazin 08/2026 PC Games 07/2026 play5 08/2026 N-Zone 07/2026 Linux Magazin 07/2026 LinuxUser 07/2026 Raspberry Pi Geek 07/2026
    PC Games Hardware PC Games Linux Magazin Raspberry Pi Geek Computec Kiosk