ARMv9 vorgestellt: Neue Prozessor-Architektur für Smartphones und Server-CPUs
Mit ARMv9 hat ARM eine neue Architektur für Prozessoren vorgestellt, die nicht nur einfache Mikrocontroller, Smartphones und Tablets befeuern dürfte, sondern auch Server-Prozessoren. Laut ARM wird sich die Performance signifikant verbessern. Auch in puncto Sicherheit und KI soll sich viel tun.
Der britische Chipentwickler ARM hat mit ARMv9 eine neue Architektur vorgestellt, die den technischen Grundstein für die nächsten zehn Jahre bilden soll. Verglichen mit ARMv8.1, die man in Cortex-A78 beziehungsweise Cortex-X1-Kernen findet, wird eine Leistungssteigerung von über 30 Prozent in Aussicht gestellt. Zukünftige Smartphone- und Tablet-Prozessoren sind aber nur eines der möglichen Einsatzgebiete. Auch beim Thema KI soll sich einiges tun. Das Stichwort lautet hier Scalable Vector Extensions 2 (SVE2), mit denen sich Daten besser parallelisieren lassen sollen.
Darunter befinden sich Instruktionen für Baseband-Anwendungen wie 4G und für maschinelles Lernen, aber auch für In-Memory-Computing bei ARM-basierten Server-CPUs. Außerdem gibt es jetzt dedizierte Beschleuniger-Einheiten für Matrix-Multiplikationen, ähnlich denen des A14 Bionic von Apple.
Bildergalerie
Neue Sicherheitsfeatures
Auch das Thema Sicherheit soll bei ARMv9 nicht zu kurz kommen. Die Confidential Compute Architecture etwa, kurz CCA, schafft mit Realms praktisch abgeschlossene, von Betriebssystem und Hypervisor angekoppelte Container. Linux Container scheint das Verfahren nicht unähnlich zu sein, nur dass es auf Hardware-Ebene stattfindet. Auch die Memory Tagging Extensions (TME) sind wieder mit von der Partie. Sie hielten allerdings schon mit ARMv8.5 und Android 11 Einzug.
Mehr zum Thema: ARM-Übernahme durch Nvidia: Staaten und Behörden könnten es Nvidia schwer machen
Welche Cortex-Kerne sich ARMv9 zunutze machen, wird abzuwarten sein. Aktuell befinden sich die für 2021 beziehungsweise 2022 geplanten Designs Matterhorn und Makalu in der Entwicklung. Erste Smartphones mit neuer Technik werden für Anfang 2022 erwartet, Server-Chips auf ARMv9-Basis dürften folgen. Anfangs werden voraussichtlich nicht alle Geräte die volle Funktionspalette der neuen Architektur unterstützen. Für Realms etwa bedarf es erst weitreichender Software-Anpassungen.


Für die MI200 wird ein Dual-Chip-Design ausgehend vom MI100 spekuliert. Ob das wie bei früheren GPUs zwei GPU-Packages auf einer Karte sein werden oder möglicherweise ein echtes MCM ist derzeit unklar. Das Intel-Design geht aber gemäß aktuell recht belastbarer Leistungswerte selbst deutlich über die doppelten (konkret sogar über die dreifachen) Leistungswerte einer MI100 hinaus.
Dazu kommt, dass nVidia im nächsten Jahr mit Hopper kommen wird, d. h. es bleibt weiterhin schwer für AMD hier Fuß zu fassen und dementsprechend wichtig sind für die der ein anderen Zuschlag bei Supercomputerausschreibungen.
Ergänzend: Der Xilinx-Deal wird erst zum Jahresende abgeschlossen werden. Darüber hinaus wird es dauern bis man hier Firmen, Personal, Kultur und KnowHow zusamengeführt haben wird und dieses in konkrete, erste Produkte mündet.
Darüber hinaus haben die schon länger spezialisierte AI-Beschleuniger, die entsprechende HW-Einheiten haben und selbst deren aktuellsten Stratix-FPGAs besitzen entsprechende Funktionalität, auch wenn die weiterhin nicht primär für AI gedacht sind. Und mit Xe-HPC wird das gar massiv ausgebaut werden, da hier nVidia's Produkte den Hauptkonkurrenten darstellen. Angeblich soll das große Design um die 1 PetaFlops AI-Leistung bieten. In dem Falle dann zweifellos nur FP16 (ggf. auch bfloat16) in Verbindung mit diesem halbwegs konkretisierten Leistungswert, aber damit stellt Xe-HPC nVidias aktuelles Topprodukt bzgl. Leistung/Watt und auch absoluter Leistung deutlich in den Schatten (und AMD braucht man hier für einen Vergleich gar nicht heranziehen, da deren MI100 da nicht wirklich konkurrieren kann).
Und btw, selbst das in aktuellen Consumer-Produkten steckende Xe-LP hat mit DP4A eine ISA-Erweiterung, die ML-Workloads beschleunigt (dabei handelt es sich zwar um keine dedizierte HW, jedoch reicht es dennoch für einen deutlichen Performance-Boost; so etwas fehlt AMD bisher auch).
Ergänzend übrigens zu Smartphones und damit ARM-SoCs. Die Topprodukte sind hier schon länger mit sogenannten NPUs ausgestattet, das ist nicht wirklich neu. Mit SVE2 geht ARM konsequent weiter und fokussiert die Entwicklung und bündelt nun SEV und die parallel entwicklete NEON-Erweiterung, insbesondere mit Blick auf Serveranwendungen. Man darf gespannt sein, was bspw. Ampere Computing in 2023 serverseitig präsentieren wird ...
Außerdem gibt es jetzt dedizierte Beschleuniger-Einheiten für Matrix-Multiplikationen, ähnlich denen des A14 Bionic von Apple.