AMD Vega: Illustrativer Die-Shot kam tatsächlich aus dem Marketing
Ein AMD-Mitarbeiter hat nun bestätigt, dass der illustrative Die-Shot von Vega 10, den AMD auf der WWDC zeigte, nicht dem tatsächlichen Die entspricht. Das lag bereits nahe, ist nun aber offiziell. Folglich kann man aus dem Bild nicht auf die Die-Größe schließen. Bleibt zu hoffen, dass das Marketing nicht auch beim Blockdiagramm geschummelt hat, das zu sehen ist. Daraus wurde nämlich auf die Shader-Zahl geschlossen.
Dieser Tage hatte AMD die WWDC von Apple genutzt, um einen Die-Shot von Vega 10 zu veröffentlichen. Schon da schrieben wir, dass es sich um ein illustratives Bild handelt und AMD hat das nun auch bestätigt. Was es zu sehen gab ist Marketing-Material, das am Computer entstanden ist. Nachdem Hard OCP Scott Wasson auf Twitter gefragt hat, wie groß den der Die nun ist, bestätigte der, dass man anhand des Bildes keine Rückschlüsse ziehen kann, da es kein echter Die ist. Offiziell bleibt die Die-Größe damit erst einmal weiter das Geheimnis von AMD.
Vom Bild - oder besser Blockdiagramm - lässt sich dennoch ableiten, dass AMD auf acht Shader Engines setzt, die jeweils 8 Compute Units umfassen. Das ist ein anderes Setup als noch bei Fiji, wo 4 Shader Engines 16 Computes Units umfassten. In der Praxis bedeutet das, dass jede Einheit nun ihren eigenen Geometrie-Prozessor und Rasterizer hat. Sollte das Marketing nicht geschummelt haben, lässt sich weiterhin von 32 Render-Backends und 128 Rasteroperatoren schließen.
Das Topmodell der Radeon Pro 500 Series hat 64 Next Compute Units, wie sie Apple nennt, das etwas kleinere Modell 56 Next Compute Units. Oder anders gesagt: Der Maximalausbau liegt bei 4.096 Shadern, das kleinere hat 3.584 Shader. Aufgrund der angegebenen Teraflops bei FP32-Berechnungen lässt sich schließen, dass die große GPU um 1.350 MHz taktet, die kleinere um 1.550 MHz. Ob es letztlich so ist, bleibt aber ungewiss. Belastbar ist dagegen die Information, dass je nach Modell 16 GiByte und 8 GiByte HBM2-Speicher vorhanden sind, die an einem 2.048 Bit breiten Interface hängen. Durch die Speicherbandbreite lässt sich auf den Takt des HBM2-Speichers schließen, der mit um 800 MHz beim kleinen Modell und um 930 MHz beim großen Modell laufen muss.

Es spricht grundsätzlich nichts dagegen, die Infinity Fabric zu verbessern oder? Auch hat das nichts mit Multi-GPU zu tun... Threadripper ist schließlich auch eine einzige CPU.
Und da hege ich momentan noch einige Zweifel ob das in allen Anwendungsfällen reibungslos klappt.
@plusminus
Es spricht grundsätzlich nichts dagegen, die Infinity Fabric zu verbessern oder? Auch hat das nichts mit Multi-GPU zu tun... Threadripper ist schließlich auch eine einzige CPU.
Der Rest sagt nur:
neue Architektur
optimiert für Deep Learning.
Und im Zusammenhang mit Spielen nennt man die zusätzlichen Texture-Units (336). Wenn man das in Relation zur Zeit sieht (2 Jahre nach Pascal welcher ja eine wiederum 2 Jahre alte Maxwell-Architektur in sich hat), zum neuen Prozess, zu den zusätzlichen Transistoren, dem neuen Speicher.... sind 50% gar nicht so viel.
Das "revolutionäre" betrifft also Die-Size und Deep Learning
Zitat Artikel:
Nvidia setzt auf der Tesla V100 einen Volta-Chip mit 5120 Cores und 80 SMs ein. Das Design erlaubt jedoch Chips mit bis zu 84 SMs und 5376 FP32-Kernen, 2688 FP64-Kernen und 672 Tensor-Cores. Für künftige Gamer-Karten interessant: Volta enthält bis zu 336 Textureinheiten. Der Chefentwickler kommentierte, dass Volta auch Spiele "ziemlich schnell" darstellen kann. Im Vergleich zu einer GeForce GTX 1080 Ti könnte eine künftige High-End-Karte mit Volta-GPU durchaus bis zu 50 Prozent mehr Performance bieten; allerdings dürften solche Karten nicht vor dem zweiten Quartal 2018 erscheinen.
Infinity-Fabric ermöglicht es ganze Dies miteinander zu verbinden, siehe Threadripper oder Epyc. Daher können diese relativ kostengünstig hergestellt werden und man bekommt weniger Probleme mit der Yield-Rate. Aktuell ist bei AMD Ryzen ein Die nötig, um von 4- bis 32-Kernern alles bereitzustellen. Ich denke diese Skalierbarkeit wird spätestens mit Navi auch Einzug bei Grafikkarten erhalten.
Leider skaliert das ganze relativ schwach "dank" moderner Renderingmethoden und ist daher ziemlich unrealistisch (dass es den Mainstream erreicht).
Vorallem bei AMDs "Effizienz" muss man immer vorsichtig sein, wenn man will, dass plötzlich 2 dieser "Heizungen" im Computer schlafen
GTC 2017: Nvidias Volta-Architektur ein Meilenstein im GPU-Design | heise online
Der Rest sagt nur:
neue Architektur
optimiert für Deep Learning.
Und im Zusammenhang mit Spielen nennt man die zusätzlichen Texture-Units (336). Wenn man das in Relation zur Zeit sieht (2 Jahre nach Pascal welcher ja eine wiederum 2 Jahre alte Maxwell-Architektur in sich hat), zum neuen Prozess, zu den zusätzlichen Transistoren, dem neuen Speicher.... sind 50% gar nicht so viel.
Das "revolutionäre" betrifft also Die-Size und Deep Learning