Fünf Jahre Radeon Vega: Technik-Finesse im Detail
Auf dieser Artikelseite verraten wir, was Vega zum technischen Hoffnungsträger machte.
In diesem Artikel
Die Pfeiler von Vega
In diesem Artikel
Der 486 Quadratmillimeter große Vega 10 ist das erste marktreife GCN-5-Produkt (GCN 1.4) und gleichzeitig die High-End-Version. Er beherbergt im Vollausbau 4.096 FP32-ALUs, 256 Textureinheiten sowie 64 Raster-Endstufen. Damit bietet der Chip genauso viele Rechenwerke wie das 2015er-Topmodell Fiji, lässt sich dank der Architekturveränderung und damals brandneuen 14-nm-Fertigung jedoch wesentlich höher takten: Mit einem Maximalboost von 1.600 MHz überbot man den eigenen High-End-Vorgänger um 52 Prozent, blieb aber hinter den zwischenzeitlich von Nvidia erreichten Frequenzen nahe 2 GHz zurück. Beim Speicher machte AMD gegenüber Fiji einen Schritt nach vorn und einen zurück. Zwar setzt auch Vega - als vorerst letzte Endkunden-Architektur - auf High-Bandwidth Memory, kurz HBM, Vega 10 arbeitet jedoch "nur" noch mit 2.048 anstatt 4.096 Datenbahnen. Auch hier musste es Takt richten, anstelle gemächlicher 500 MHz arbeitet Vega 10 mit bis zu 945 MHz und erreicht damit bei geringerer Verdrahtungskomplexität beinahe die Transferrate seines Vorgängers. Ursprünglich war für HBM zweiter Generation ("gen2") ein rundes Gigahertz avisiert, in Serie setzt Vega auf 1,89 Gigatransfers pro Sekunde (1,6 GT/s bei der Vega 56).
Quelle: PC Games Hardware
Vega-10-Package: Direkt unter dem Rechenkern sitzen die beiden HBM-Stapel à 4 GiByte Kapazität.
HBM2 ist zwar flächenmäßig größer als HBM1, ermöglicht jedoch Stapel mit je bis zu 8 GiByte Kapazität ("8-Hi"), wohingegen HBM1 auf je 1 GiByte limitiert war - der wohl größte Schwachpunkt der Fiji-Grafikkarten. Speichermangel ist bei HBM2 kein Thema, im Rahmen der Spezifikation und technischen Möglichkeiten sind Grafikkarten mit bis zu 32 GiByte möglich. Die Radeon Vega Frontier Edition machte im Juni 2017 mit 16 GiByte den Anfang. Die Gaming-Ableger der "Radeon RX Vega"-Reihe mussten sich ab August 2017 mit 2 × 4 GiByte HBM2 begnügen.
Auch was die DirectX-12-Kompatibilität angeht, war Vega fortschrittlich: Der Chip unterstützt das Feature-Level 12_1 und überbietet bei den optionalen Einzeldisziplinen Nvidias Pascal-Riege. Erfahrungsgemäß wird von Spiele-Entwicklern jedoch der kleinste gemeinsame Nenner genommen, sodass derartige Kniffe ungenutzt bleiben.
| Grafikkarte | Radeon RX Vega 64 Liquid | Radeon RX Vega 64 Air | Radeon RX Vega 56 Air | Radeon Vega Frontier Air | Geforce GTX 1080 Ti | Geforce GTX 1080 | Geforce GTX 1070 |
|---|---|---|---|---|---|---|---|
| Codename | Vega 10 XTX | Vega 10 XT | Vega 10 XL | Vega 10 GLXTX | GP102-350-K1 | GP104-400 | GP104-300 |
| DX-12-Feature-Level | 12_1 | 12_1 | 12_1 | 12_1 | 12_1 | 12_1 | 12_1 |
| Chipgröße (reiner Die) | 486 mm² | 486 mm² | 486 mm² | 486 mm² | 471 mm² | 314 mm² | 314 mm² |
| Transistoren Grafikchip (Mio.) | 12.500 | 12.500 | 12.500 | 12.500 | 12.000 | 7.200 | 7.200 |
| Shader-/SIMD-/Textureinheiten | 4.096/64/256 | 4.096/64/256 | 3.584/64/224 | 4.096/64/256 | 3.584/28/224 | 2.560/20/160 | 1.920/15/120 |
| Raster-Endstufen (ROPs) | 64 | 64 | 64 | 64 | 88 | 64 | 64 |
| Typischer GPU-Boost (MHz) | 1.677 | 1.546 | 1.471 | 1.382 | 1.582 | 1.733 | 1.683 |
| Rechenleistung SP/DP (Mio./s) | 13.738/859 | 12.665/792 | 10.544/659 | 11.321/708 | 11.340/354 | 8.873/277 | 6.463/202 |
| Durchsatz Pixel/Texel (Mrd./s) | 107,3/429,3 | 98,9/395,8 | 94,1/329,5 | 88,4/353,8 | 141,7/354,1 | 110,9/277,3 | 101,0/202,0 |
| Speicheranbindung (Bit) | 2.048 | 2.048 | 2.048 | 2.048 | 352 | 256 | 256 |
| Geschw. Grafikspeicher (GT/s) | 1,89 | 1,89 | 1,6 | 1,89 | 11,0 | 10,0 | 8,0 |
| Speichertyp | HBM gen2 | HBM gen2 | HBM gen2 | HBM gen2 | GDDR5X | GDDR5X | GDDR5 |
| Speicherübertragung (GB/s) | 483,8 | 483,8 | 409,6 | 483,8 | 484,0 | 320,0 | 256,0 |
| Übliche Speichermenge (MiB) | 8.192 | 8.192 | 8.192 | 16.384 | 11.264 | 8.192 | 8.192 |
| PCI-Express-Stromanschlüsse | 2× 8-polig | 2× 8-polig | 2× 8-polig | 2× 8-polig | Je 1× 6-/8-polig | 1× 8-polig | 1× 8-polig |
| Typische Leistungsaufnahme | <345 Watt | <295 Watt | <210 Watt | <300 Watt | <250 Watt | <180 Watt | <150 Watt |
Vega entspricht der fünften Iteration des Graphics Core Next und stellt laut AMD die größte Architekturumstellung seit GCN 1.0 (Radeon HD 7000 alias Tahiti) dar. Die Veränderungen innerhalb des Kerns widmen sich sowohl der Leistung pro Einheit als auch der Taktbarkeit. Während Letztere ein immer hilfreicher Kniff ist, erfordern die anderen Features eine Zusammenarbeit zwischen Hard- und Software. Da wäre "Rapid Packed Math" (RPM): Vega ist in der Lage, Operationen mit reduzierter Genauigkeit, wie FP16 und INT8, in doppelter respektive vierfacher Rate des üblichen FP32-Formats auszuführen. Die Idee ist schlüssig (wenn auch steinalt), erfordert jedoch die explizite Anpassung durch Spieleentwickler.
Das gilt auch für die sogenannten Shader Intrinsics. Die Lower-Level-APIs Vulkan und DirectX 12 erlauben es Programmierern, direkter mit der Hardware zu kommunizieren. Der Zugriff erfolgt dennoch über Umwege, die Anfragen werden über API-Befehle an den Treiber übersetzt, welcher daraus letztendlich den Maschinen-Code für die GPU schnitzt. Hier setzen die Shader-Intrinsics-Funktionen an: Entwickler können der (GCN-)Hardware - wie auf den Konsolen - direkt mitteilen, was sie von ihr wollen und wie sie es wollen. Wer die Zeit investiert, kann somit hochoptimierten Code erschaffen und die GPU bestmöglich auslasten.
In eine ähnliche Kerbe schlagen die Primitive Shaders. Auch hierbei handelt es sich um einen Ansatz, welcher "closer to the metal", sprich näher an der Hardware ist als der Weg über die zahlreichen Abstraktionsschichten und Rechenschritte (Stages) eines Direct3D (11). Dazu ist es wichtig zu wissen, dass Vegas Frontend, wie jenes von Fiji und Polaris, pro Takt höchstens vier Polygone (Dreiecke) erzeugen kann. Das hätte man entweder durch massiven Transistoraufwand steigern können oder mithilfe eines cleveren Software-Ansatzes. AMD hat sich für Letzteren entschieden und bewirbt in dessen Kontext die "Next-generation geometry engine" von Vega - das wohl wichtigste Feature.
Ein Rendering-Grundproblem ist, dass am Anfang des Prozesses nicht bekannt ist, welche Objekte im finalen Bild sichtbar sind. Es wird folglich sehr viel Arbeit/Zeit aufgewendet, um Geometrie zu erzeugen, die am Ende verworfen wird. Je schneller dieses Culling stattfindet, desto eher kann die sichtbare Geometrie gerendert werden - praktisch erhöht sich also der Polygondurchsatz. AMD nennt den Faktor 4,25, welcher auch dadurch erreicht wird, dass die Vertexdaten in Vegas 4 MiByte großem Level-2-Cache abgelegt werden können und ein intelligenter Verteiler, der die Aufgaben für Geometry-, Compute- und Pixel-Engines delegiert, das Sagen hat. Die Krux ist, dass nur Letzterer im aktiven Dienst ist. AMDs ursprüngliche Planung sah vor, Entwicklern im Treiber die genannten Funktionen als "Vega NGG Fast Path" anzubieten, da keine aktuelle API entsprechende Aufrufe beinhaltet. Davon fehlt jede Spur. Das und die relativ geringe Marktdurchdringung von Vega-GPUs führten dazu, dass es nie zu einem NGG-Pfad in Spielen kam und das Front-End somit einen Flaschenhals darstellt.

Das ist eine Karte für Bastler und Tweaker. Man kann viel aus der Karte rausholen bei massiver Verbrauchssenkung.
Out of the Box war die richtig Kacke.
?? Bei jeder Karte kann man einiges rausholen.