Angriff auf Intel und Apple: Nvidia und AMD entwickeln ARM-Chips [Gerücht]

News 24.10.2023 um 11:15 Uhr Claus Ludewig Als bevorzugte Quelle auf Google hinzufügen

Quelle: Apple

Angeblich entwickeln sowohl AMD als auch Nvidia ARM-Chips für Windows-PCs. Damit soll zum Angriff gegen die Macbooks und ihre M-Chips ausgeholt werden.

Im Vergleich zu AMD- und Intel-CPUs, die auf den x86-Befehlssatz setzen, arbeiten ARM-Chips unter anderem in Smartphones mit dem namensgebenden Befehlssatz. Bei vergleichsweise geringem Stromverbrauch können ARM-Chipsätze viel Leistung und eine lange Akkulaufzeit bieten, vorausgesetzt die Software und das Betriebssystem sind angepasst. Nachdem Qualcomm bereits den Snapdragon X vorbereitet, wird nun AMD und Nvidia nachgesagt, ebenfalls an ARM-SoCs für Windows-Laptops zu schrauben. Wie die Nachrichtenagentur Reuters meldet, sollen zwei mit der Sache vertraute Quellen erklärt haben, dass zumindest Nvidia schon fortgeschritten ist in der Entwicklung.

Was ist der Vorteil von ARM-Chips?

Mit den M-Chips auf ARM-Basis hatte Apple im Jahr 2020 eigene Prozessoren entwickelt, die in den MacBooks mit viel Leistung überzeugen und für lange Akkulaufzeiten mit mindestens 10 Stunden sorgen. Um dies mit Intel- oder AMD-CPUs zu schaffen, sind vergleichsweise große und teure Akkus notwendig. Bereits seit dem Jahr 2017 gibt es auch bei Microsoft Bemühungen, einen ARM-Chipsatz in Notebooks einzubauen. Allerdings gibt es bislang nur wenige damit ausgerüstete Laptops oder 2-in-1-Tablets. Die meisten Programme für Windows sind für den x86-Befehlssatz geschrieben. Folglich müssen die EXE-Dateien neu kompiliert werden, um nativ auf ARM-Prozessoren laufen zu können. Wenn Programme emuliert werden, fällt die Leistung geringer aus. Erst seit Windows 11 aus dem Jahr 2021 gibt es die Option, 64-Bit-Programme zu emulieren.

Beim kommenden Snapdragon X kommen dabei Oryon-CPU-Kerne zum Einsatz, die auf die Technik von Nuvia aufbauen. Im Jahr 2021 hatte Qualcomm das Start-up mit ehemaligen Apple-Ingenieuren übernommen. Nuvia-Mitarbeiter entwickelten die ersten M-Chips für Apple, die etwa im Macbook ihren Dienst verrichten. Laut Leaks soll das Top-Modell Snapdragon X Elite auf 12 CPU-Kerne setzen und eine Adreno-Grafikeinheit mit 4,6 TFLOPS bieten. Folglich wäre der für Dezember angekündigte SoC schneller als eine Xbox Series S. Zu den angeblich geplanten Chips von AMD und Nvidia gibt es noch keine weiteren Details. Nachdem Nvidia im Jahr 2020 vergeblich versucht hatte, das britische Unternehmen ARM aufzukaufen, ist es nun wohl ein neuer Anlauf. In der Nintendo Switch verrichtet etwa ein Nvidia Tegra seinen Dienst, ein ARM-Chipsatz mit GPU von Nvidia.

Ebenfalls lesenswert: Snapdragon X Elite: 12 Oryon-Kerne mit bis zu 4,3 GHz auch für Windows-PCs

Empfohlener redaktioneller Inhalt [EMBED_URL] An dieser Stelle finden Sie externe Inhalte von [PLATTFORM]. Zum Schutz Ihrer persönlichen Daten werden externe Einbindungen erst angezeigt, wenn Sie dies durch Klick auf "Alle externen Inhalte laden" bestätigen: Ich bin damit einverstanden, dass mir externe Inhalte angezeigt werden. Damit werden personenbezogene Daten an Drittplattformen übermittelt. Mehr dazu in unserer Datenschutzerklärung.

Externe Inhalte Mehr dazu in unserer Datenschutzerklärung.

Sammlung zu möglichen ARM-Chips von AMD und Nvidia für Windows:

Wie die Nachrichtenagentur Reuters meldet, sollen AMD und Nvidia an eigenen ARM-Chips für Windows-Laptops arbeiten.
Im Vergleich zu Intel- oder AMD-CPUs auf dem bisherigen x86-Befehlssatz können ARM-Chipsätze stromsparender arbeiten, sodass es eine längere Akkulaufzeit gibt. Voraussetzung sind jedoch ein angepasstes Betriebssystem und Software.
Neben Qualcomm mit dem Snapdragon X sollen auch AMD und Nvidia an ARM-Chipsätzen schrauben.

Quelle: Reuters

Artikel teilen

Angriff auf Intel und Apple: Nvidia und AMD entwickeln ARM-Chips [Gerücht] Angeblich entwickeln sowohl AMD als auch Nvidia ARM-Chips für Windows-PCs. Damit soll zum Angriff gegen die Macbooks und ihre M-Chips ausgeholt werden.

Per E-Mail versenden

- Kommentare (32)
  Zur Diskussion im Forum
  
  Von Gerwald Freizeitschrauber(in)
  
  Ich finde das ja ganz nett was ihr hier so diskutiert. Nur ich sehe da ganz andere Problem. Weil bevor eine Software auf ARM optimiert werden kann muss es mal diese Software geben.
  Denn die tollste CPU ist nutzlos ohne Software. Das heißt die Softwaren Hersteller müssen sehr schnell die Software für die ARM anbieten. Da wird es aber eine Übergangszeit geben. Genau in der Zeit wird man wenig bis gar keine optimierte Software für ARM finden. Weil die Software für x86 und ARM bereithalten müssen. Da werden die keinen Bock haben, kein Geld oder Reserven zum Anpassen der Software.
  
  Das hat damals als Apple von PowerCPU aus Intel umgestiegen ist eine Zeit gedauert. Nur geht das in der Apple Welt schneller. Nur Apple baut Apple Computer. Daher kann sich jeder drauf verlassen das ist jetzt die CPU der Zukunft. Das andere Apple USER machen so einen Umstieg schneller mit. Im Gegensatz dazu sind Windows USER Jammer, die ständig was zum Aussetzen haben.
  
  Wenn man denkt die PC-Welt soll auf ARM umsteigen, wird man mit den damit leben müssen das es eben Seine Zeit dauert, bis das alles mal richtig läuft.
  Ich würde es mir zwar Wünschen das einen Umstieg gibt, aber ob es gelingt? Die PC-Welt ist halt auch um einiges komplexer als die Apple Welt.
  
  Zitieren
  
  Von Gerwald Freizeitschrauber(in)
  
  Ich finde das ja ganz nett was ihr hier so diskutiert. Nur ich sehe da ganz andere Problem. Weil bevor eine Software auf ARM optimiert werden kann muss es mal diese Software geben.
  Denn die tollste CPU ist nutzlos ohne Software. Das heißt die Softwaren Hersteller müssen sehr schnell die Software für die ARM anbieten. Da wird es aber eine Übergangszeit geben. Genau in der Zeit wird man wenig bis gar keine optimierte Software für ARM finden. Weil die Software für x86 und ARM bereithalten müssen. Da werden die keinen Bock haben, kein Geld oder Reserven zum Anpassen der Software.
  
  Das hat damals als Apple von PowerCPU aus Intel umgestiegen ist eine Zeit gedauert. Nur geht das in der Apple Welt schneller. Nur Apple baut Apple Computer. Daher kann sich jeder drauf verlassen das ist jetzt die CPU der Zukunft. Das andere Apple USER machen so einen Umstieg schneller mit. Im Gegensatz dazu sind Windows USER Jammer, die ständig was zum Aussetzen haben.
  
  Wenn man denkt die PC-Welt soll auf ARM umsteigen, wird man mit den damit leben müssen das es eben Seine Zeit dauert, bis das alles mal richtig läuft.
  Ich würde es mir zwar Wünschen das einen Umstieg gibt, aber ob es gelingt? Die PC-Welt ist halt auch um einiges komplexer als die Apple Welt.
  
  Zitieren
  
  Von PCGH_Torsten Kokü-Junkie (m/w)
  
  "auf der möglichst viel Anwendersoftware läuft"
  !=
  "33 Jahre alter 386er, den UMC mal in Kooperation mit ALI in einen Controller gepackt hat, der dadurch Teil des ULI-Portfolios wurde, welches Nvidia später komplett übernahm"
  
  Zitieren
  
  Von Poulton Volt-Modder(in)
  
  Zitat von PCGH_Torsten
  
  Aber Nvidia braucht eine CPU zu den eigenen GPUs, auf der möglichst viel Anwendersoftware läuft.
  
  Aber Nvidia hat doch auch x86:
  [Ins Forum, um diesen Inhalt zu sehen]
  
  Zitat
  
  The M6117C is a highly integrated, low voltage, single-chip implementation of Intel 386SX compatible microprocessor plus ULi M1217B chipset.
  
  scnr
  
  Zitieren
  
  Von PCGH_Torsten Kokü-Junkie (m/w)
  
  Die Decoder an sich lassen sich genauso gut verkleinern wie auch normale Rechenwerke. Aber genau wie diese werden sie immer mächtiger – Netburst hatte scheinbar nur eine einzige Decoder-Pipeline und sich sonst auf seinen Micro-Op-Cache verlassen, um vier Ausführungseinheiten auszulasten (sportlich, sportlich). Bei Alder Lake sind es selbst für jeden E-Kern zwei Decoder mit drei Pipelines, zusätzlich zum Cache. Außerdem werden Decodereinheiten an sich um so komplexer, je größer der Befehlssatz wird – von SSE2 bis AVX2 ist eine ganze Menge hinzugekommen. Eine relativ zu den Ausführungseinheiten konstante Größe ist also plausibel. Was passiert, wenn man Decoderressourcen relativ zum Rechenwerk einsparen möchte, haben ja Bulldozer und Piledriver mit einem Decoder je Modul bewiesen – erst als es mit Steamroller einen Decoder pro Int-Kern gab, konnten AMDs APUs im angestrebten Low-End-Segment austeilen.
  
  Out of Order an sich ist unabhängig von der Architektur. Alle x86-Intel-Prozessoren bis einschließlich der Sockel-7-Pentiums waren in Order und danach noch einmal die erste Atom-Architektur sowie darauf aufbauend Xeon Phi. Ich schätze mal, die für die IME verwendeten Kerne im PCH sind es bis heute (aber die sind praktisch nicht dokumentiert). Bei AMD müsste es bis einschließlich K5 gewesen sein, über Geode und die anderen Mitbewerber fehlt mir aber gerade der Überblick. Umgekehrt sind alle leistungsfähigeren ARM-Kerne OoO. Aber: Der Aufwand, der für effektiven OoO-Betrieb nötig ist, hängt von der Komplexität des Chipsatzes ab.
  
  Bei RISC sieht die Spungvorhersage direkt im Programmcode, was als nächstes kommen könnte und jede RISC-Berechnung liefert ein Endergebnis. Bei CISC-to-RISC muss man im Front-End die Decoding-Verzögerung einplanen und entsprechend weiter vorausgucken; die Sortierung im Back-End muss Zwischenergebnisse zurück an den Anfang leiten und prüfen, ob bis zu einem CISC-Retirement noch andere RISC-Micro-Ops abgewartet werden müssen. Das alles braucht auch mehr Zeit, womit das Zeitfenster von einem CISC-Befehl bis zum nächsten, der darauf aufbauen darf, noch größer wird. Um Leerlauf zu vermeiden muss eine OoO-CISC-to-RISC-CPU also mehr Rechenaufgaben insgesamt im Blick behalten als ein reine OoO-RISC-Design. Ich weiß, wie gesagt, nicht, wie viele Transistoren das genau kostet. Aber in aller Regel gilt in der Halbleitertechnik: Klingt es kompliziert? Dann ist die Implementierung kompliziert².
  
  Umgekehrt gibt diese Komplexität den CPU-Entwicklern aber auch Ansatzpunkte für Verbesserungen. Wenn Front- und Backend den Ansprüchen gerecht werden, können sie den Berechnungsablauf optimal für die vorhandenen Pipelines koordinieren. Bei RISC dagegen wird das dem Compiler oder gar dem Entwickler überlassen. Optimieren die sauber, wäre das Programm genauso flüssig wie beim perfekten CISC-to-RISC ablaufen – aber noch nicht zwingend schneller, denn der Programmcode ist Kern-ferner gespeichert als Microcode. Ich schätze mal, dass die langsameren Zugriffe darauf mit ein Grund sind, warum x86 bei schlecht parallelisierbaren Code bis heute ungeschlagen bleibt, obwohl Sprungvorhersage & Co bei AMD und Intel natürlich auch nicht perfekt arbeiten und händisch optimierter ARM-Code somit einen Vorteil in der Programm-Logik haben kann. Die Regel dürfte aber mit hoher Wahrscheinlichkeit das Gegenteil sein: Niemand programmiert so nah am Silizium, die Möglichkeiten eines offline arbeitenden Compilers gegenüber einer just-in-time-Sprungvorhersage haben auch nicht unendlich viel Potenzial und umgekehrt kennt niemand AMD- und Intel-Kerne so gut, wie AMD- respektive Intel-Entwickler. So passen die dekodierten Micro-Ops in einer x86-CPU dann doch wieder besser zu den Recheneinheiten, als bei einem nativen ARM-Kern, wo der Entwickler eigentlich alles direkt unter Kontrolle hat.
  
  Zitieren
  
  Von Rollora Kokü-Junkie (m/w)
  
  Zitat von PCGH_Torsten
  
  10 bis 15 Prozent ist der Flächenbedarf der Decoder-Einheit und zugehöriger Speicher im Inneren aktueller AMD- und Intel-Kernen.
  
  das ist interessant, danke. Ich dachte nicht, dass das weiter so mitwächst (bzw. nicht schrumpft). Denn diese Zahl kenn ich aus P4 Zeiten und ich bin davon ausgegangen, dass dieser Teil der CPU nicht bzw. kaum weiterentwickelt werden muss und daher immer schrumpft, oder ist das ähnlich wie bei IO, dass es nicht ge"shrinked" werden kann
  
  Zitat von PCGH_Torsten
  
  Weitere 15 bis 30 Prozent des Kerns gehen für Out of Order drauf, also Sprungvorhersage, Scheduling, Queing, diverse zugehörige Zwischenspeicher und Puffer, etc.. Eine genaue Angabe ist schwer möglich, da vor allem die Load-/Store-Funktionalität ziemlich verteilt ist.
  
  aber OoO hat ja jetzt nichts mit x86 zu tun, oder sehe ich das falsch. Ob ich jetzt eine in Order oder Out of Order ISA entwerfe, ist ja eine Designentscheidung. Außer es ist so, dass bei x86 eine OoO ISA quasi verpflichtet. Ich meine mich erinnern zu können, dass Intel es 1-2x mit In-Order probiert hat (originaler Atom), und grandios gescheitert ist - ich dachte aber nicht, dass das an x86 liegt
  
  Zitat von PCGH_Torsten
  
  ARM-Kerne arbeiten zwar auch überwiegend OoO, aber da die Laufzeit der simplen RISC-Befehle kürzer ist, sollten sie für eine vergleichbare Auslastung weniger Befehle in flight haben und weniger Wartepositionen benötigen – ein Programm kann eben nicht unerwartet einen noch zu decodierenden Befehl aufrufen oder eine komplexe Sprunganweisung triggern, wenn es gar keine zu decodierenden oder komplexe Befehle gibt. Folglich könnte ein ARM-Kern entweder eine deutlich bessere Auslastung seiner Recheneinheiten bei gleichem Flächenverbrauch erzielen oder aber die Auslastung aktuelle x86-Designs mit einem geringeren Transistorbudget für OoO-Hilfseinheiten. Wie groß das Einsparpotenzial jenseits des Decoders tatsächlich ist, kann ich aber nur raten – deswegen die sehr große Spanne.
  
  hmm ok. Versteh ich leider nur zum Teil, weil du weiter oben ja angedeutet hast, dass x86 gerade wegen der guten Auslastung der Rechenwerke geeignet ist. Vielleicht habe ich das falsch verstanden.
  
  Zitat von PCGH_Torsten
  
  (Alle Flächenangeben relativ zum eigentlichen Rechenkern. Also ohne L2, L3 und externe Anbindung. Der Rest der CPU hat natürlich eine vielfach größere Fläche, aber deren Anteil am Stromverbrauch unter Volllast ist vergleichsweise klein – und der Bedarf daran wäre bei einer ARM-CPU gleicher Leistungsklasse ohnehin gleich groß.)
  
  Ja, ich war auch wenig klar in meiner Formulierung: ich ging nicht vom reinen x86 Kern aus, sondern von der ganzen CPU.
  Aber es stimmt schon: macht natürlich auch nur wenig Sinn Cache hier ranzuziehen. IO und Co vielleicht noch eher.
  
  Zitieren
  
  Direkt zum Diskussionsende

Hoch

Print / Abo

Apps

Die Redaktion Datenschutz Artikel-Archiv Datenschutz-Optionen Mediadaten Impressum Utiq verwalten Abo kündigen Vertrag widerrufen AGB Inhalt melden Newsletter

Was ist der Vorteil von ARM-Chips?

Artikel teilen

Kommentare (32)