Angriff auf Intel und Apple: Nvidia und AMD entwickeln ARM-Chips [Gerücht]
Angeblich entwickeln sowohl AMD als auch Nvidia ARM-Chips für Windows-PCs. Damit soll zum Angriff gegen die Macbooks und ihre M-Chips ausgeholt werden.
Im Vergleich zu AMD- und Intel-CPUs, die auf den x86-Befehlssatz setzen, arbeiten ARM-Chips unter anderem in Smartphones mit dem namensgebenden Befehlssatz. Bei vergleichsweise geringem Stromverbrauch können ARM-Chipsätze viel Leistung und eine lange Akkulaufzeit bieten, vorausgesetzt die Software und das Betriebssystem sind angepasst. Nachdem Qualcomm bereits den Snapdragon X vorbereitet, wird nun AMD und Nvidia nachgesagt, ebenfalls an ARM-SoCs für Windows-Laptops zu schrauben. Wie die Nachrichtenagentur Reuters meldet, sollen zwei mit der Sache vertraute Quellen erklärt haben, dass zumindest Nvidia schon fortgeschritten ist in der Entwicklung.
Was ist der Vorteil von ARM-Chips?
Mit den M-Chips auf ARM-Basis hatte Apple im Jahr 2020 eigene Prozessoren entwickelt, die in den MacBooks mit viel Leistung überzeugen und für lange Akkulaufzeiten mit mindestens 10 Stunden sorgen. Um dies mit Intel- oder AMD-CPUs zu schaffen, sind vergleichsweise große und teure Akkus notwendig. Bereits seit dem Jahr 2017 gibt es auch bei Microsoft Bemühungen, einen ARM-Chipsatz in Notebooks einzubauen. Allerdings gibt es bislang nur wenige damit ausgerüstete Laptops oder 2-in-1-Tablets. Die meisten Programme für Windows sind für den x86-Befehlssatz geschrieben. Folglich müssen die EXE-Dateien neu kompiliert werden, um nativ auf ARM-Prozessoren laufen zu können. Wenn Programme emuliert werden, fällt die Leistung geringer aus. Erst seit Windows 11 aus dem Jahr 2021 gibt es die Option, 64-Bit-Programme zu emulieren.
Beim kommenden Snapdragon X kommen dabei Oryon-CPU-Kerne zum Einsatz, die auf die Technik von Nuvia aufbauen. Im Jahr 2021 hatte Qualcomm das Start-up mit ehemaligen Apple-Ingenieuren übernommen. Nuvia-Mitarbeiter entwickelten die ersten M-Chips für Apple, die etwa im Macbook ihren Dienst verrichten. Laut Leaks soll das Top-Modell Snapdragon X Elite auf 12 CPU-Kerne setzen und eine Adreno-Grafikeinheit mit 4,6 TFLOPS bieten. Folglich wäre der für Dezember angekündigte SoC schneller als eine Xbox Series S. Zu den angeblich geplanten Chips von AMD und Nvidia gibt es noch keine weiteren Details. Nachdem Nvidia im Jahr 2020 vergeblich versucht hatte, das britische Unternehmen ARM aufzukaufen, ist es nun wohl ein neuer Anlauf. In der Nintendo Switch verrichtet etwa ein Nvidia Tegra seinen Dienst, ein ARM-Chipsatz mit GPU von Nvidia.
Ebenfalls lesenswert: Snapdragon X Elite: 12 Oryon-Kerne mit bis zu 4,3 GHz auch für Windows-PCs
Sammlung zu möglichen ARM-Chips von AMD und Nvidia für Windows:
- Wie die Nachrichtenagentur Reuters meldet, sollen AMD und Nvidia an eigenen ARM-Chips für Windows-Laptops arbeiten.
- Im Vergleich zu Intel- oder AMD-CPUs auf dem bisherigen x86-Befehlssatz können ARM-Chipsätze stromsparender arbeiten, sodass es eine längere Akkulaufzeit gibt. Voraussetzung sind jedoch ein angepasstes Betriebssystem und Software.
- Neben Qualcomm mit dem Snapdragon X sollen auch AMD und Nvidia an ARM-Chipsätzen schrauben.
Quelle: Reuters

Denn die tollste CPU ist nutzlos ohne Software. Das heißt die Softwaren Hersteller müssen sehr schnell die Software für die ARM anbieten. Da wird es aber eine Übergangszeit geben. Genau in der Zeit wird man wenig bis gar keine optimierte Software für ARM finden. Weil die Software für x86 und ARM bereithalten müssen. Da werden die keinen Bock haben, kein Geld oder Reserven zum Anpassen der Software.
Das hat damals als Apple von PowerCPU aus Intel umgestiegen ist eine Zeit gedauert. Nur geht das in der Apple Welt schneller. Nur Apple baut Apple Computer. Daher kann sich jeder drauf verlassen das ist jetzt die CPU der Zukunft. Das andere Apple USER machen so einen Umstieg schneller mit. Im Gegensatz dazu sind Windows USER Jammer, die ständig was zum Aussetzen haben.
Wenn man denkt die PC-Welt soll auf ARM umsteigen, wird man mit den damit leben müssen das es eben Seine Zeit dauert, bis das alles mal richtig läuft.
Ich würde es mir zwar Wünschen das einen Umstieg gibt, aber ob es gelingt? Die PC-Welt ist halt auch um einiges komplexer als die Apple Welt.
!=
"33 Jahre alter 386er, den UMC mal in Kooperation mit ALI in einen Controller gepackt hat, der dadurch Teil des ULI-Portfolios wurde, welches Nvidia später komplett übernahm"
[Ins Forum, um diesen Inhalt zu sehen]
Out of Order an sich ist unabhängig von der Architektur. Alle x86-Intel-Prozessoren bis einschließlich der Sockel-7-Pentiums waren in Order und danach noch einmal die erste Atom-Architektur sowie darauf aufbauend Xeon Phi. Ich schätze mal, die für die IME verwendeten Kerne im PCH sind es bis heute (aber die sind praktisch nicht dokumentiert). Bei AMD müsste es bis einschließlich K5 gewesen sein, über Geode und die anderen Mitbewerber fehlt mir aber gerade der Überblick. Umgekehrt sind alle leistungsfähigeren ARM-Kerne OoO. Aber: Der Aufwand, der für effektiven OoO-Betrieb nötig ist, hängt von der Komplexität des Chipsatzes ab.
Bei RISC sieht die Spungvorhersage direkt im Programmcode, was als nächstes kommen könnte und jede RISC-Berechnung liefert ein Endergebnis. Bei CISC-to-RISC muss man im Front-End die Decoding-Verzögerung einplanen und entsprechend weiter vorausgucken; die Sortierung im Back-End muss Zwischenergebnisse zurück an den Anfang leiten und prüfen, ob bis zu einem CISC-Retirement noch andere RISC-Micro-Ops abgewartet werden müssen. Das alles braucht auch mehr Zeit, womit das Zeitfenster von einem CISC-Befehl bis zum nächsten, der darauf aufbauen darf, noch größer wird. Um Leerlauf zu vermeiden muss eine OoO-CISC-to-RISC-CPU also mehr Rechenaufgaben insgesamt im Blick behalten als ein reine OoO-RISC-Design. Ich weiß, wie gesagt, nicht, wie viele Transistoren das genau kostet. Aber in aller Regel gilt in der Halbleitertechnik: Klingt es kompliziert? Dann ist die Implementierung kompliziert².
Umgekehrt gibt diese Komplexität den CPU-Entwicklern aber auch Ansatzpunkte für Verbesserungen. Wenn Front- und Backend den Ansprüchen gerecht werden, können sie den Berechnungsablauf optimal für die vorhandenen Pipelines koordinieren. Bei RISC dagegen wird das dem Compiler oder gar dem Entwickler überlassen. Optimieren die sauber, wäre das Programm genauso flüssig wie beim perfekten CISC-to-RISC ablaufen – aber noch nicht zwingend schneller, denn der Programmcode ist Kern-ferner gespeichert als Microcode. Ich schätze mal, dass die langsameren Zugriffe darauf mit ein Grund sind, warum x86 bei schlecht parallelisierbaren Code bis heute ungeschlagen bleibt, obwohl Sprungvorhersage & Co bei AMD und Intel natürlich auch nicht perfekt arbeiten und händisch optimierter ARM-Code somit einen Vorteil in der Programm-Logik haben kann. Die Regel dürfte aber mit hoher Wahrscheinlichkeit das Gegenteil sein: Niemand programmiert so nah am Silizium, die Möglichkeiten eines offline arbeitenden Compilers gegenüber einer just-in-time-Sprungvorhersage haben auch nicht unendlich viel Potenzial und umgekehrt kennt niemand AMD- und Intel-Kerne so gut, wie AMD- respektive Intel-Entwickler. So passen die dekodierten Micro-Ops in einer x86-CPU dann doch wieder besser zu den Recheneinheiten, als bei einem nativen ARM-Kern, wo der Entwickler eigentlich alles direkt unter Kontrolle hat.
Aber es stimmt schon: macht natürlich auch nur wenig Sinn Cache hier ranzuziehen. IO und Co vielleicht noch eher.