Online-Abo
Login Registrieren
Games World
  • Vega Architektur: Next-Gen-Compute-Units, High-Bandwidth-Cache & mehr vorgestellt
    Quelle: PC Games Hardware

    Vega Architektur: Next-Gen-Compute-Units, High-Bandwidth-Cache & mehr vorgestellt

    AMD hat einen umfassenden Ausblick auf seine Vega-Architektur alias Graphics Core Next (GCN) Gen 5 gegeben. Viele Teile innerhalb der GPU werden gegenüber Polaris (GCN Gen 4) umgebaut, um eine höhere Performance bei gleichzeitig höherer Effizienz zu erreichen. PC Games Hardware war im Dezember auf AMDs Tech Summit dabei und gibt einen ersten Ausblick auf Vega.

    Vega ist die langersehnte fünfte Iteration von AMDs Grafikarchitektur GCN und soll nach Polaris wieder den High-End-Markt bedienen. Im kalifornischen Sonoma hat AMD innerhalb eines Tech-Days einen ersten Ausblick auf die Vega-Architektur gegeben. Damit wir uns nicht falsch verstehen: Es wurden abseits der bereits vorgestellten Radeon Instinct MI25 keine konkreten Produkte angekündigt. Zudem ist der Chiphersteller nur selten auf konkrete GPU-Spezifikationen eingegangen. Auch dann war meistens nur die Rede von "Vega" - nur manchmal ist den Ingenieuren der Name "Vega 10" von den Lippen gerutscht. Sofern wir von einer konkreten GPU schreiben, werden wir also den Namen "Vega 10" verwenden.

    01:09
    Vega: AMD stellt die Eckpfeiler der GPU-Architektur im Video vor

    Vega: Next-Gen Compute Units

          

    Zum ersten Mal seit der Einführung des Graphics Core Next im Jahre 2011 nimmt AMD größere Änderungen an den Compute Units vor. Die Texaner nennen das Ganze deshalb jetzt Next-Gen Compute Units oder kurz NCUs. Eine NCU kann 512 mögliche 8-, 256 16- und 128 32-Bit-Operationen in einem 4:2:1-Verhältnis berechnen. Möglich wäre, dass AMD von 64 Shader in einer CU auf 128 in einer NCU aufstockt - fast schon ironisch: AMD ginge dann genau den anderen Weg als Nvidia, der mit GP100 erst auf 64 Shader/SM für HPC-Anwendungen heruntergegangen ist. Die FP64-Leistung für doppelte Genauigkeit sei "konfigurierbar" - eine mögliche doppelte Rate wurde nicht bestätigt.

    Darüber hinaus sollen die NCUs für "signifikant" höhere Taktraten ausgelegt worden sein und gleichzeitig eine insgesamt höhere Leistung pro Takt (IPC) erreichen. Die Instruction Buffer innerhalb der NCUs werden größer.

    Vega: 128 FP32-Operationen pro Takt und NCU deuten 128 Shader in einer NCU an Vega: 128 FP32-Operationen pro Takt und NCU deuten 128 Shader in einer NCU an Quelle: AMD (Screenshot: PCGH) Vega: Optimierung auf höheren Takt Vega: Optimierung auf höheren Takt Quelle: AMD (Screenshot: PCGH)

    Vega: Stärkeres Front-End

          

    Das Front-End ist ein altes Thema bei AMD. Viele GPUs hatten in den letzten Jahren ein verhältnismäßig schwaches Front-End, das seit der Einführung von GCN erst mit Tonga (R9 285, R9 380[X]) als Vierfach-Ausführung für 32 Compute Units als stark angesehen werden konnte. Das gleiche Front-End wurde jedoch für die deutlich größere Fiji-GPU (R9 Fury [X], R9 Nano) unverändert beibehalten, sodass die 64 CUs nur selten bis fast nie optimal ausgelastet werden können.

    Bei Vega spricht AMD nun von einem mindestens doppelt so starken Front-End. In den Fußnoten gibt AMD an, dass "Vega designt wurde, bis zu 11 Polygone pro Takt mit vier Geometry Engines zu erzeugen" - und deutet damit an, dass Vega 10 weiterhin vier Shader Engines zur Organisation nutzt. Gegenüber Fiji entsprechen 11 Polygone pro Takt einer Steigerung um den Faktor 2,6. Ein effektiv gesteigerter Durchsatz könnte durch das Verwerfen von Dreiecken erreicht werden, die in der finalen Szene gar nicht sichtbar wären - der tile-based Ansatz böte zumindest die entsprechenden Voraussetzungen.

    Im Wesentlichen kann Vega jetzt mit Primitive Shadern umgehen, statt die Render-Pipeline in Vertex- und Geometry Shader aufzuteilen. Diese Primitive Shader sollen über API-Erweiterungen nutzbar sein, schnellere Calls ermöglichen und Entwicklern mehr Kontrolle geben. Darüber hinaus bekommt Vega den "intelligenten" Workgroup Distributor, der schon in der PS4 Pro zum Einsatz kommt und die NCUs besser füttern soll.

    Vega: Primitive Shader Vega: Primitive Shader Quelle: AMD (Screenshot: PCGH)

    Vega: Überarbeitetes Back-End

          

    Im Falle des Back-Ends setzt AMD auf eine "komplett neue" Next Generation Pixel Engine mit einem Draw Stream Binning Rasterizer, der sich wie ein tile-based Rasterizer verhalten soll (aber keinen echten darstellt). An dieser Stelle haperte es bislang an den letzten Direct3D_12.1-Features, die mit einer Komplettüberarbeitung jetzt nachgereicht werden sollten (!). Die Pixel Engine kann jetzt, ohne den Umweg über den Speichercontroller zu gehen, auf den L2-Cache zugreifen, was vor allem in Spielen, die Deferred Shading nutzen, Vorteile bringen soll.

    Vega: High-Bandwidth Cache Controller

          

    Vega sieht einen High-Bandwidth Cache Controller, der in der GPU sitzt (On-Chip) und auf externen Speicher auf einem Interposer zugreift (On-Package), vor. Das kann HBM2 sein, ist jedoch nicht darauf limitiert. AMD könnte beispielsweise auch - rein theoretisch - den auf niedrige Latenzen optimierten Hybrid Memory Cube (HMC) nutzen, den Intel bei Knights Landing einsetzt. Die Rede ist von einem bis zu 512 Terabyte großen virtuellen Adressbereich. Der HBCC kann den kompletten On-Package-Speicher oder auch nur einen Teil davon als L3-Cache nutzen. Das Ganze sei variabel einstellbar und mit verschiedenen Modi, zum Beispiel inclusive oder exclusive, nutzbar. Interessant könnte die Idee bei einem Konstrukt wie der Radeon Pro SSG werden, wo die GPU auf eine SSD als Grafikspeicher zugreifen kann.

    Die doppelte Bandbreite pro Pin deutet darauf hin, dass AMD den HBM2 mit den vollen vorgesehen 1.000 MHz (2 Gbps) laufen lässt. Insgesamt möchte AMD die RAM-Nutzung verbessert haben. Bisher belege man zwei bis drei Mal mehr Speicher, als von einem Spiel tatsächlich genutzt würde. Verantwortlich dafür zeichnet sich der Draw Stream Binning Rasterizer mit dem Tiled-Based-Ansatz.

    Vega: Übersicht der Verbesserungen Vega: Übersicht der Verbesserungen Quelle: AMD (Screenshot: PCGH)

    Vega: Shader-Compiler und Infinity Fabric

          

    Mit Vega möchte AMD einen neuen Shader-Compiler einführen, der die Effizienz potenziell deutlich verbessern könnte - der aktuelle Compiler gilt als eher schlecht denn gut. Zudem werden die verschiedenen GPU-Teile wie alle kommenden Ryzen-CPUs über den Infinity Fabric verbunden, der bei Vega 10 ein "Mesh" darstellen soll. Eine APU mit Zen-Kernen und Vega-GPU sollte sich so relativ unkompliziert realisieren lassen.

    Werbefrei auf PCGH.de und im Forum surfen - jetzt informieren.
    01:30
    Radeon Vega: AMD zeigt Video "Nach dem Aufstand"
    Wissenswert: Mehr Informationen zum Thema finden Sie in:
    AMD Radeon Treiber Download: Crimson Relive Edition 17.6.1
      • Von NeilPatrickHarris Gesperrt
        Zitat von Meroveus
        Stimmt das hast du anhand der Vollausbauten. Mein Fehler, ich wollte nur auf Nummer sicher gehen .
        Ja, genau. GP104 vs. GM200 ist aus genannten Punkten schwierig, GP102 vs. GM200 passt deutlich besser.
      • Von Meroveus Software-Overclocker(in)
        Zitat von NeilPatrickHarris
        Ja, das hatte ich doch weiter ausgeführt?
        Stimmt das hast du anhand der Vollausbauten. Mein Fehler, ich wollte nur auf Nummer sicher gehen .
      • Von NeilPatrickHarris Gesperrt
        Zitat von Meroveus
        Meinst du damit das unter Berücksichtigung des Speicherinterface´s (weil kleiner weniger Transistoren benötigt), beide Karten dann die gleiche Anzahl an Transistoren hätten (wenn beide das gleiche Interface hätten) und somit Pascal mehr Transistoren pro Shader verbraucht als Maxwell ?
        Ja, das hatte ich doch weiter ausgeführt?

        Zitat von Meroveus
        Naja ganz so schlimm ist es nicht NVIDIA GeForce GTX 1080 Final Specifications and Launch Presentation | VideoCardz.com aber ich weis was du mir damit sagen willst.
        +50% Speicherinterface, +50% ROPs, +50% L2 Cache etc. pp.

        Alles Transistoren, die GM200 zusätzlich verballert. Daher auch der Vergleich GP102/GM200.
      • Von Meroveus Software-Overclocker(in)
        Zitat von NeilPatrickHarris
        Und der 384bit Speicherbus der GTX980Ti ist umsonst und kostet keine Transistoren?
        Meinst du damit das unter Berücksichtigung des Speicherinterface´s (weil kleiner weniger Transistoren benötigt), beide Karten dann die gleiche Anzahl an Transistoren hätten (wenn beide das gleiche Interface hätten) und somit Pascal mehr Transistoren pro Shader verbraucht als Maxwell ?

        Zitat
        Außerdem hat GM200 noch das doppelte an ROPs, mehr TAUs/TMUs, 50% mehr L2 Cache etc. pp.
        Naja ganz so schlimm ist es nicht NVIDIA GeForce GTX 1080 Final Specifications and Launch Presentation | VideoCardz.com aber ich weis was du mir damit sagen willst.
      • Von NeilPatrickHarris Gesperrt
        Zitat von Meroveus
        GTX 980 Ti - 2816 Shader - 8 Mrd. Transistoren = 2,84 Mio. Transistoren pro Shader

        GTX 1080 - 2560 Shader - 7,2 Mrd. Transistoren = 2,81 Mio. Transistoren pro Shader

        Somit verbaucht doch Maxwell mehr Transistoren pro Shader als Pascal, nur die Packdichte ändert sich, oder hab ich da einen Denk / Rechenfehler ?
        Und der 384bit Speicherbus der GTX980Ti ist umsonst und kostet keine Transistoren?

        Außerdem hat GM200 noch das doppelte an ROPs, mehr TAUs/TMUs, 50% mehr L2 Cache etc. pp.

        Hätte ich vllt dazu schreiben soll: Man sollte die ähnlichen Chips vergleichen, in diesem Falle also GP102 vs. GM200. Der GP102 braucht bei identischer ROP-Anzahl und identischem Speicherinterface für ca. 26% mehr Shader (3840 statt 3072 für GM200) 50% mehr Transistoren.

        Da hatte ich einen Brainfart, das nicht direkt zu schreiben

        Zitat von Meroveus
        Das weis ich doch, mir ging es nur um das wenn.
        Es gibt eben kein "wenn". Eine GTX980Ti würde auch in 16nm keine 2,6GHz schaffen.
  • Print / Abo
    Apps
    PC Games Hardware 07/2017 PC Games 06/2017 PC Games MMore 07/2017 play³ 07/2017 Games Aktuell 07/2017 buffed 12/2016 XBG Games 07/2017
    PCGH Magazin 07/2017 PC Games 06/2017 PC Games MMORE Computec Kiosk On the Run! Birdies Run
article
1217460
Vega
Vega Architektur: Next-Gen-Compute-Units, High-Bandwidth-Cache & mehr vorgestellt
AMD hat einen umfassenden Ausblick auf seine Vega-Architektur alias Graphics Core Next (GCN) Gen 5 gegeben. Viele Teile innerhalb der GPU werden gegenüber Polaris (GCN Gen 4) umgebaut, um eine höhere Performance bei gleichzeitig höherer Effizienz zu erreichen. PC Games Hardware war im Dezember auf AMDs Tech Summit dabei und gibt einen ersten Ausblick auf Vega.
http://www.pcgameshardware.de/Vega-Codename-265481/Specials/Architektur-NCU-HBCC-Vorstellung-1217460/
05.01.2017
http://www.pcgameshardware.de/screenshots/medium/2017/01/Vega-Final-Presentation_Seite_02-pcgh_b2teaser_169.png
specials