Vega Architektur: Next-Gen-Compute-Units, High-Bandwidth-Cache & mehr vorgestellt

AMD hat einen umfassenden Ausblick auf seine Vega-Architektur alias Graphics Core Next (GCN) Gen 5 gegeben. Viele Teile innerhalb der GPU werden gegenüber Polaris (GCN Gen 4) umgebaut, um eine höhere Performance bei gleichzeitig höherer Effizienz zu erreichen. PC Games Hardware war im Dezember auf AMDs Tech Summit dabei und gibt einen ersten Ausblick auf Vega.

230

Special 05.01.2017 um 15:00 Uhr Mark Mantel Als bevorzugte Quelle auf Google hinzufügen

Quelle: PC Games Hardware

Auf dieser Seite

1 Vega: Next-Gen Compute Units
2 Vega: Stärkeres Front-End
3 Vega: Überarbeitetes Back-End
4 Vega: High-Bandwidth Cache Controller
5 Vega: Shader-Compiler und Infinity Fabric

Vega ist die langersehnte fünfte Iteration von AMDs Grafikarchitektur GCN und soll nach Polaris wieder den High-End-Markt bedienen. Im kalifornischen Sonoma hat AMD innerhalb eines Tech-Days einen ersten Ausblick auf die Vega-Architektur gegeben. Damit wir uns nicht falsch verstehen: Es wurden abseits der bereits vorgestellten Radeon Instinct MI25 keine konkreten Produkte angekündigt. Zudem ist der Chiphersteller nur selten auf konkrete GPU-Spezifikationen eingegangen. Auch dann war meistens nur die Rede von "Vega" - nur manchmal ist den Ingenieuren der Name "Vega 10" von den Lippen gerutscht. Sofern wir von einer konkreten GPU schreiben, werden wir also den Namen "Vega 10" verwenden.

Vega: Next-Gen Compute Units

Zum ersten Mal seit der Einführung des Graphics Core Next im Jahre 2011 nimmt AMD größere Änderungen an den Compute Units vor. Die Texaner nennen das Ganze deshalb jetzt Next-Gen Compute Units oder kurz NCUs. Eine NCU kann 512 mögliche 8-, 256 16- und 128 32-Bit-Operationen in einem 4:2:1-Verhältnis berechnen. Möglich wäre, dass AMD von 64 Shader in einer CU auf 128 in einer NCU aufstockt - fast schon ironisch: AMD ginge dann genau den anderen Weg als Nvidia, der mit GP100 erst auf 64 Shader/SM für HPC-Anwendungen heruntergegangen ist. Die FP64-Leistung für doppelte Genauigkeit sei "konfigurierbar" - eine mögliche doppelte Rate wurde nicht bestätigt.

Darüber hinaus sollen die NCUs für "signifikant" höhere Taktraten ausgelegt worden sein und gleichzeitig eine insgesamt höhere Leistung pro Takt (IPC) erreichen. Die Instruction Buffer innerhalb der NCUs werden größer.

Quelle: AMD (Screenshot: PCGH) Vega: 128 FP32-Operationen pro Takt und NCU deuten 128 Shader in einer NCU an Quelle: AMD (Screenshot: PCGH) Vega: Optimierung auf höheren Takt

Vega: Stärkeres Front-End

Das Front-End ist ein altes Thema bei AMD. Viele GPUs hatten in den letzten Jahren ein verhältnismäßig schwaches Front-End, das seit der Einführung von GCN erst mit Tonga (R9 285, R9 380[X]) als Vierfach-Ausführung für 32 Compute Units als stark angesehen werden konnte. Das gleiche Front-End wurde jedoch für die deutlich größere Fiji-GPU (R9 Fury [X], R9 Nano) unverändert beibehalten, sodass die 64 CUs nur selten bis fast nie optimal ausgelastet werden können.

Bei Vega spricht AMD nun von einem mindestens doppelt so starken Front-End. In den Fußnoten gibt AMD an, dass "Vega designt wurde, bis zu 11 Polygone pro Takt mit vier Geometry Engines zu erzeugen" - und deutet damit an, dass Vega 10 weiterhin vier Shader Engines zur Organisation nutzt. Gegenüber Fiji entsprechen 11 Polygone pro Takt einer Steigerung um den Faktor 2,6. Ein effektiv gesteigerter Durchsatz könnte durch das Verwerfen von Dreiecken erreicht werden, die in der finalen Szene gar nicht sichtbar wären - der tile-based Ansatz böte zumindest die entsprechenden Voraussetzungen.

Im Wesentlichen kann Vega jetzt mit Primitive Shadern umgehen, statt die Render-Pipeline in Vertex- und Geometry Shader aufzuteilen. Diese Primitive Shader sollen über API-Erweiterungen nutzbar sein, schnellere Calls ermöglichen und Entwicklern mehr Kontrolle geben. Darüber hinaus bekommt Vega den "intelligenten" Workgroup Distributor, der schon in der PS4 Pro zum Einsatz kommt und die NCUs besser füttern soll.

Quelle: AMD (Screenshot: PCGH) Vega: Primitive Shader

Vega: Überarbeitetes Back-End

Im Falle des Back-Ends setzt AMD auf eine "komplett neue" Next Generation Pixel Engine mit einem Draw Stream Binning Rasterizer, der sich wie ein tile-based Rasterizer verhalten soll (aber keinen echten darstellt). An dieser Stelle haperte es bislang an den letzten Direct3D_12.1-Features, die mit einer Komplettüberarbeitung jetzt nachgereicht werden sollten (!). Die Pixel Engine kann jetzt, ohne den Umweg über den Speichercontroller zu gehen, auf den L2-Cache zugreifen, was vor allem in Spielen, die Deferred Shading nutzen, Vorteile bringen soll.

Vega: High-Bandwidth Cache Controller

Vega sieht einen High-Bandwidth Cache Controller, der in der GPU sitzt (On-Chip) und auf externen Speicher auf einem Interposer zugreift (On-Package), vor. Das kann HBM2 sein, ist jedoch nicht darauf limitiert. AMD könnte beispielsweise auch - rein theoretisch - den auf niedrige Latenzen optimierten Hybrid Memory Cube (HMC) nutzen, den Intel bei Knights Landing einsetzt. Die Rede ist von einem bis zu 512 Terabyte großen virtuellen Adressbereich. Der HBCC kann den kompletten On-Package-Speicher oder auch nur einen Teil davon als L3-Cache nutzen. Das Ganze sei variabel einstellbar und mit verschiedenen Modi, zum Beispiel inclusive oder exclusive, nutzbar. Interessant könnte die Idee bei einem Konstrukt wie der Radeon Pro SSG werden, wo die GPU auf eine SSD als Grafikspeicher zugreifen kann.

Die doppelte Bandbreite pro Pin deutet darauf hin, dass AMD den HBM2 mit den vollen vorgesehen 1.000 MHz (2 Gbps) laufen lässt. Insgesamt möchte AMD die RAM-Nutzung verbessert haben. Bisher belege man zwei bis drei Mal mehr Speicher, als von einem Spiel tatsächlich genutzt würde. Verantwortlich dafür zeichnet sich der Draw Stream Binning Rasterizer mit dem Tiled-Based-Ansatz.

Quelle: AMD Vega: Übersicht der Verbesserungen

Vega: Shader-Compiler und Infinity Fabric

Mit Vega möchte AMD einen neuen Shader-Compiler einführen, der die Effizienz potenziell deutlich verbessern könnte - der aktuelle Compiler gilt als eher schlecht denn gut. Zudem werden die verschiedenen GPU-Teile wie alle kommenden Ryzen-CPUs über den Infinity Fabric verbunden, der bei Vega 10 ein "Mesh" darstellen soll. Eine APU mit Zen-Kernen und Vega-GPU sollte sich so relativ unkompliziert realisieren lassen.