Fünf Jahre Radeon Vega: Technik-Finesse im Detail

Test 14.08.2022 um 09:30 Uhr Raffael Vötter Als bevorzugte Quelle auf Google hinzufügen

Auf dieser Artikelseite verraten wir, was Vega zum technischen Hoffnungsträger machte.

In diesem Artikel

Seite 1 Fünf Jahre Radeon Vega: Geschichtsstunde
Seite 2 Fünf Jahre Radeon Vega: Technik-Finesse im Detail
Seite 3 Fünf Jahre Radeon Vega: Zwischenstand um 2019
Seite 4 Fünf Jahre Radeon Vega: Nachtest 2022
Seite 5 Fünf Jahre Radeon Vega: Fazit
Seite 6 Bildergalerie
Die Pfeiler von Vega

Der 486 Quadratmillimeter große Vega 10 ist das erste marktreife GCN-5-Produkt (GCN 1.4) und gleichzeitig die High-End-Version. Er beherbergt im Vollausbau 4.096 FP32-ALUs, 256 Textureinheiten sowie 64 Raster-Endstufen. Damit bietet der Chip genauso viele Rechenwerke wie das 2015er-Topmodell Fiji, lässt sich dank der Architekturveränderung und damals brandneuen 14-nm-Fertigung jedoch wesentlich höher takten: Mit einem Maximalboost von 1.600 MHz überbot man den eigenen High-End-Vorgänger um 52 Prozent, blieb aber hinter den zwischenzeitlich von Nvidia erreichten Frequenzen nahe 2 GHz zurück. Beim Speicher machte AMD gegenüber Fiji einen Schritt nach vorn und einen zurück. Zwar setzt auch Vega - als vorerst letzte Endkunden-Architektur - auf High-Bandwidth Memory, kurz HBM, Vega 10 arbeitet jedoch "nur" noch mit 2.048 anstatt 4.096 Datenbahnen. Auch hier musste es Takt richten, anstelle gemächlicher 500 MHz arbeitet Vega 10 mit bis zu 945 MHz und erreicht damit bei geringerer Verdrahtungskomplexität beinahe die Transferrate seines Vorgängers. Ursprünglich war für HBM zweiter Generation ("gen2") ein rundes Gigahertz avisiert, in Serie setzt Vega auf 1,89 Gigatransfers pro Sekunde (1,6 GT/s bei der Vega 56).

Quelle: PC Games Hardware Vega-10-Package: Direkt unter dem Rechenkern sitzen die beiden HBM-Stapel à 4 GiByte Kapazität.
HBM2 ist zwar flächenmäßig größer als HBM1, ermöglicht jedoch Stapel mit je bis zu 8 GiByte Kapazität ("8-Hi"), wohingegen HBM1 auf je 1 GiByte limitiert war - der wohl größte Schwachpunkt der Fiji-Grafikkarten. Speichermangel ist bei HBM2 kein Thema, im Rahmen der Spezifikation und technischen Möglichkeiten sind Grafikkarten mit bis zu 32 GiByte möglich. Die Radeon Vega Frontier Edition machte im Juni 2017 mit 16 GiByte den Anfang. Die Gaming-Ableger der "Radeon RX Vega"-Reihe mussten sich ab August 2017 mit 2 × 4 GiByte HBM2 begnügen.

Auch was die DirectX-12-Kompatibilität angeht, war Vega fortschrittlich: Der Chip unterstützt das Feature-Level 12_1 und überbietet bei den optionalen Einzeldisziplinen Nvidias Pascal-Riege. Erfahrungsgemäß wird von Spiele-Entwicklern jedoch der kleinste gemeinsame Nenner genommen, sodass derartige Kniffe ungenutzt bleiben.

Grafikkarte	Radeon RX Vega 64 Liquid	Radeon RX Vega 64 Air	Radeon RX Vega 56 Air	Radeon Vega Frontier Air	Geforce GTX 1080 Ti	Geforce GTX 1080	Geforce GTX 1070
Codename	Vega 10 XTX	Vega 10 XT	Vega 10 XL	Vega 10 GLXTX	GP102-350-K1	GP104-400	GP104-300
DX-12-Feature-Level	12_1	12_1	12_1	12_1	12_1	12_1	12_1
Chipgröße (reiner Die)	486 mm²	486 mm²	486 mm²	486 mm²	471 mm²	314 mm²	314 mm²
Transistoren Grafikchip (Mio.)	12.500	12.500	12.500	12.500	12.000	7.200	7.200
Shader-/SIMD-/Textureinheiten	4.096/64/256	4.096/64/256	3.584/64/224	4.096/64/256	3.584/28/224	2.560/20/160	1.920/15/120
Raster-Endstufen (ROPs)	64	64	64	64	88	64	64
Typischer GPU-Boost (MHz)	1.677	1.546	1.471	1.382	1.582	1.733	1.683
Rechenleistung SP/DP (Mio./s)	13.738/859	12.665/792	10.544/659	11.321/708	11.340/354	8.873/277	6.463/202
Durchsatz Pixel/Texel (Mrd./s)	107,3/429,3	98,9/395,8	94,1/329,5	88,4/353,8	141,7/354,1	110,9/277,3	101,0/202,0
Speicheranbindung (Bit)	2.048	2.048	2.048	2.048	352	256	256
Geschw. Grafikspeicher (GT/s)	1,89	1,89	1,6	1,89	11,0	10,0	8,0
Speichertyp	HBM gen2	HBM gen2	HBM gen2	HBM gen2	GDDR5X	GDDR5X	GDDR5
Speicherübertragung (GB/s)	483,8	483,8	409,6	483,8	484,0	320,0	256,0
Übliche Speichermenge (MiB)	8.192	8.192	8.192	16.384	11.264	8.192	8.192
PCI-Express-Stromanschlüsse	2× 8-polig	2× 8-polig	2× 8-polig	2× 8-polig	Je 1× 6-/8-polig	1× 8-polig	1× 8-polig
Typische Leistungsaufnahme	<345 Watt	<295 Watt	<210 Watt	<300 Watt	<250 Watt	<180 Watt	<150 Watt

Vega entspricht der fünften Iteration des Graphics Core Next und stellt laut AMD die größte Architekturumstellung seit GCN 1.0 (Radeon HD 7000 alias Tahiti) dar. Die Veränderungen innerhalb des Kerns widmen sich sowohl der Leistung pro Einheit als auch der Taktbarkeit. Während Letztere ein immer hilfreicher Kniff ist, erfordern die anderen Features eine Zusammenarbeit zwischen Hard- und Software. Da wäre "Rapid Packed Math" (RPM): Vega ist in der Lage, Operationen mit reduzierter Genauigkeit, wie FP16 und INT8, in doppelter respektive vierfacher Rate des üblichen FP32-Formats auszuführen. Die Idee ist schlüssig (wenn auch steinalt), erfordert jedoch die explizite Anpassung durch Spieleentwickler.

Das gilt auch für die sogenannten Shader Intrinsics. Die Lower-Level-APIs Vulkan und DirectX 12 erlauben es Programmierern, direkter mit der Hardware zu kommunizieren. Der Zugriff erfolgt dennoch über Umwege, die Anfragen werden über API-Befehle an den Treiber übersetzt, welcher daraus letztendlich den Maschinen-Code für die GPU schnitzt. Hier setzen die Shader-Intrinsics-Funktionen an: Entwickler können der (GCN-)Hardware - wie auf den Konsolen - direkt mitteilen, was sie von ihr wollen und wie sie es wollen. Wer die Zeit investiert, kann somit hochoptimierten Code erschaffen und die GPU bestmöglich auslasten.

In eine ähnliche Kerbe schlagen die Primitive Shaders. Auch hierbei handelt es sich um einen Ansatz, welcher "closer to the metal", sprich näher an der Hardware ist als der Weg über die zahlreichen Abstraktionsschichten und Rechenschritte (Stages) eines Direct3D (11). Dazu ist es wichtig zu wissen, dass Vegas Frontend, wie jenes von Fiji und Polaris, pro Takt höchstens vier Polygone (Dreiecke) erzeugen kann. Das hätte man entweder durch massiven Transistoraufwand steigern können oder mithilfe eines cleveren Software-Ansatzes. AMD hat sich für Letzteren entschieden und bewirbt in dessen Kontext die "Next-generation geometry engine" von Vega - das wohl wichtigste Feature.

Ein Rendering-Grundproblem ist, dass am Anfang des Prozesses nicht bekannt ist, welche Objekte im finalen Bild sichtbar sind. Es wird folglich sehr viel Arbeit/Zeit aufgewendet, um Geometrie zu erzeugen, die am Ende verworfen wird. Je schneller dieses Culling stattfindet, desto eher kann die sichtbare Geometrie gerendert werden - praktisch erhöht sich also der Polygondurchsatz. AMD nennt den Faktor 4,25, welcher auch dadurch erreicht wird, dass die Vertexdaten in Vegas 4 MiByte großem Level-2-Cache abgelegt werden können und ein intelligenter Verteiler, der die Aufgaben für Geometry-, Compute- und Pixel-Engines delegiert, das Sagen hat. Die Krux ist, dass nur Letzterer im aktiven Dienst ist. AMDs ursprüngliche Planung sah vor, Entwicklern im Treiber die genannten Funktionen als "Vega NGG Fast Path" anzubieten, da keine aktuelle API entsprechende Aufrufe beinhaltet. Davon fehlt jede Spur. Das und die relativ geringe Marktdurchdringung von Vega-GPUs führten dazu, dass es nie zu einem NGG-Pfad in Spielen kam und das Front-End somit einen Flaschenhals darstellt.

Fünf Jahre Radeon Vega: Technik-Finesse im Detail

In diesem Artikel

Artikel teilen

Kommentare (74)