Intel Arrow und Lunar Lake: Diese Befehlssatzerweiterungen unterstützen die neuen CPUs

9
News Oliver Jäger Als bevorzugte Quelle auf Google hinzufügen
Intel hat ein Update für seine Befehlssatzerweiterungen veröffentlicht, welche auch die zukünftigen CPU-Generationen Arrow und Lunar Lake berücksichtigt.
Quelle: Intel

Für den Juni hat Intel ein Update seiner Architektur-Befehlssatzerweiterungen veröffentlicht, welches auch die zukünftigen CPU-Generationen Arrow und Lunar Lake berücksichtigt. Unterstützt werden etwa AVX-VNNI, SHA512, SM3, SM4 und LAM. Zudem hat Intel neue CPUIDs für den Raptor-Lake-Refresh ergänzt.

Der Raptor-Lake-Refresh wird dieses Jahr als 14. CPU-Generation für den Desktop erwartet. Wie es danach weitergeht, ist wie so häufig nicht gesichert, Intel hat aber nun Arrow und Lunar Lake im aktualisierten "Handbuch" der "Architecture Instruction Set Extensions and Future Features" erwähnt. Mit diesen Desktop-CPU-Reihen, beginnend mit Arrow Lake 2024, wird es dann voraussichtlich weitergehen, während Meteor Lake auf mobile Umgebungen beschränkt sein soll.

Arrow und Lunar Lake mit Unterstützung gewisser Befehlssatzerweiterungen

Intels aktualisierte Dokumentensammlung für die Befehlssatzerweiterungen legt nun also dar, welche von diesen durch Arrow und Lunar Lake unterstützt werden. Videocardz hat die entsprechende Tabelle aus dem fast 200 Seiten langen PDF herausgepickt und die Befehlssatzerweiterungen festgehalten. Zuerst wäre da AVX-VNNI, die auch eine gewisse Bedeutung hat. Diese Befehlssatzerweiterung soll die Leistung von Inferenz-Workloads neuronaler Netzwerke verbessern, indem sie eine spezielle Funktion für 8-Bit- und 16-Bit-Integer-Operationen bereitstellt. Dies heißt also, dass Anwendungen, die künstliche Intelligenz, maschinelles Lernen und Deep-Learning-Algorithmen nutzen, mit einer Steigerung der Verarbeitungsgeschwindigkeit und Effizienz rechnen können.

Auch interessant: Intel Core Ultra: Kommt Meteor Lake-S doch noch durch die Hintertür?

Ebenso wie die Prozessor-Familien Sierra Forest und Grand Ridge für andere Anwendungszwecke bekommen Alder und Lunar Lake auch Unterstützung für Linear Address Making (LAM). Damit ließen sich nicht übersetzte Adressbits von linearen 64-Bit-Adressen für Metadaten nutzen. Erwähnt werden überdies die Befehle SHA512, SM3 und SM4, die die Sicherheits- und Verschlüsselungsfähigkeiten der CPU-Serien der nächsten Generationen verbessern sollen.

Befehlssatzerweiterungen für Arrow und Lunar Lake. Quelle: Intel Befehlssatzerweiterungen für Arrow und Lunar Lake. Alle weiteren Neuigkeiten bei den Befehlssatzerweiterungen sind im Intel-Dokument (auf den PDF-Seiten 20 und 21) farblich unterlegt und so leicht nachzuvollziehen. Intel hat letztlich noch weiter CPUIDs für zukünftige Prozessoren der Raptor-Lake-Mikroarchitektur hinzugefügt, was den Refresh-Release dieses Jahr weiter bekräftigen würde.

Quelle: Intel via Videocardz

9
    • Kommentare (9)

      Zur Diskussion im Forum
      • Von Rollora Kokü-Junkie (m/w)
        Zitat von Locuza
        Sieht schwer danach aus, als ob das bei Arrow-Lake und Lunar-Lake nicht enthalten bzw. aktiv sein wird.
        Weil wir geredet haben:
        [Ins Forum, um diesen Inhalt zu sehen]
      • Von latiose88 BIOS-Overclocker(in)
        Ja mit der schlechten oder kaum bis garnicht vorhanden sein von avx 512, wird es auch mit den Programmen schwierig umzusetzen sein. Und mit alten aber fördernden Programmen sieht die Sache auch nicht viel besser aus. Mag zwar sein das ich ein Programm habe das 5 % bei avx 512 zu legt. Und das dank AMD wo esauf 2xavx 256 verteilt drauf reagiert hat. Besser wird es mit avx 512 darum ja nicht werden. Es sei denn ich hoffe auf ein Wunder. Aber da kann ich lange drauf warten. Denke mal so schlecht ist ja AMDs Lösung ja nicht oder doch?
      • Von PCGH_Torsten Kokü-Junkie (m/w)
        Ein Problem könnte auch das Scheduling sein: Eine 4:1-Umsetzung von AVX512 (die technisch sicherlich auch nicht ganz so einfach ist) wäre sehr langsam und würde Teile des E-Kernes für untypisch lange Zeiträume blockieren und könnte ganze Programmabläufe durcheinander bringen. Eigentlich müsste der entsrechende Thread also immer vorausschauend auf einen P-Core verlegt werden, bevor AVX512-Befehle in nennenswertem Umfange ausgeführt werden. Aber so schnell muss das Scheduling erstmal reagieren können und vor allem braucht man erst einmal genug P-Cores dafür: Wenn ein Programm intensiven Gebrauch von AVX512 machen würde, weil die CPU Kompatibilität signalisiert, wären die E-Cores praktisch stillgelegt. Dabei kann es durchaus sein, dass die gleiche Aufgabenstellung in AVX2, aber auf viermal so vielen Kernen pro cm² Silizium sogar schneller abgearbeitet werden könnte. Nur sieht das Programm nicht, wie performant welcher Kern mit welchem Befehlssatz arbeitet und die CPU kann nachträglich nichts mehr ändern, wenn die Aufgabe einmal im falschen Befehlssatz gestellt wurde.

        Aktuell scheint Intel wohl der Meinung zu sein, dass "gar kein AVX512" in der Mehrheit der Anwendungsszenarien die bessere Wahl ist. Respektive man integriert die Befehle, die doch sinnvoll erscheinen, einfach in neue 256-Bit-basierte Befehlssätze – "AVX512" als solches gibt es ja sowieso nicht, sondern meinem Wissen nach mittlerweile rund ein dutzend verschiedene Zusammenstellungen mit 512-Bit-Befehlen, die sich zwar alle überlappen, die aber nicht identisch sind. Da ist es dann vermutlich auch aus Entwicklersicht unattraktiv, irgendeine Inkarnation vollständig auszureizen und stattdessen sollte man sich einzelne Kommandos rauspicken, die für den jeweilien Use-Case wirklich Sinn ergeben. In Anbetracht dessen, dass selbst für die Sierra-Forest-Xeons bislang kein Support bekannt ist, sind das aber wohl öfters "gar keine".
      • Von Locuza Lötkolbengott/-göttin
        Zitat von latiose88
        ok verstehe,das sind ja nur neue Befehle,keine extra neue Einheiten.Das heißt es spielt keine Rolle wie viele neue Befehle dazu kommen,mehr Transistoren wird dazu ja nicht dazu kommen oder ist das bei Intel doch der Fall?
        Diese Befehle sind keine reine Softwaresache, die Hardware muss diese umsetzen.
        Abseits von ein paar sehr langsamen Implementierungen und praktisch der Emulation über Microcode, werden viele Befehle über neue Hardware und Verschaltungen verwirklicht, was dann auch (deutlich) mehr Transistoren benötigt.
        Je nachdem wie man es macht, kommen auch mehr (ganze) Recheneinheiten ins Spiel.
        Z.B. wenn man 512b Operationen in einem Zyklus unterstützen möchte, dann braucht es doppelt soviele Execution Units gegenüber 256b Ops.
        Intels Server-Produkte haben logisch gesehen an Port 5 eine extra 512b Unit.
        Der Support für AVX512 zieht sich aber durch den ganzen Kern, auch bei den normalen Client-Cores.
        Denn für AVX512 (was auch die Client-Cores in HW unterstützen), hat Intel die Datenpfade zu den Caches verdoppelt, auch die Shuffle Unit wurde auf 512b erweitert.
        Das frisst alles extra Transistoren.

        Das Dumme ist nun, dass Intel kein AVX512 auf den E-Cores in der HW unterstützt, entsprechend schaltet man es auch auf den P-Cores ab, damit der Befehlssatz zwischen beiden gleich bleibt.
        Jetzt war die Frage, ob irgendwann der Tag kommt, mit neuen Fertigungsknoten und Shrink, wo Intel AVX512-Support auch zu den E-Cores bringt?
        Zumindest kann man das nun höchstwahrscheinlich für Meteor Lake, Arrow Lake und Lunar Lake verneinen.
        Falls AVX512 umgesetzt wird, dann in/nach 2025.

        Im Zweifel ist es auch gar nicht sooo teuer, AVX512 zu unterstützen, man könnte es auch (sehr) langsam umsetzen.
        Anstatt 512b Register zu verbauen, könnte die HW auch einfach entsprechend mehr 128b oder 256b Register reservieren.
        Genauso könnte man 128/256b EUs 512b Befehle über mehrere Zyklen abarbeiten lassen, AMD macht das mit Zen 4.
        Zen 1 hatte auch nur 128b Register und EUs, dabei aber 256b AVX1/2-Befehle unterstützt.
        Aktuell sind die E-Kerne auf 128b auf der FPU-Seite ausgelegt, die Brücke bzw. die Kompromisse für AVX512 sind vielleicht zu krass aus Intels Sicht und vielleicht möchte man sich auch nicht ein Upgrade auf 256b leisten.
      • Von latiose88 BIOS-Overclocker(in)
        ok verstehe,das sind ja nur neue Befehle,keine extra neue Einheiten.Das heißt es spielt keine Rolle wie viele neue Befehle dazu kommen,mehr Transistoren wird dazu ja nicht dazu kommen oder ist das bei Intel doch der Fall?
      Direkt zum Diskussionsende
  • Print / Abo
    Apps
    PCGH Magazin 07/2026 PC Games 06/2026 play5 07/2026 N-Zone 06/2026 Linux Magazin 06/2026 LinuxUser 06/2026 Raspberry Pi Geek 07/2026
    PC Games Hardware PC Games Linux Magazin Raspberry Pi Geek Computec Kiosk