AMD Steamroller: Neue Architektur mit besserem Frontend und mehr Singlethread-Leistung
Die kommende Steamroller-Architektur, also die dritte Evolutionsstufe von Bulldozer, soll laut AMD ein aufgebohrtes Frontend mit doppeltem Decoder und deutlich mehr Singlethread-Leistung bieten. Weiterhin arbeitet der Hersteller an einem besseren Performance-pro-Watt-Verhältnis.
Die erste Bulldozer-Generation, welche derzeit als FX-Serie im Handel ist und erst kürzlich Zuwachs durch den FX-4130 erhielt, kann zwar auf Kosten der Leistungsaufnahme bei stark parallelisierten Aufgaben mit viel Integer-Code überzeugen, die Leistung pro Takt und auch die Singlethread-Performance ist im Vergleich zu den Phenom II wie auch der Intel-Konkurrenz vergleichsweise schwach. Das Modulkonzept, bei welchem sich diverse Recheneinheiten ein gemeinsames Frontend teilen, wurde daher schon bei der Piledriver-Architektur (in Form von Trinity) zugunsten von mehr Leistung leicht aufgebohrt.
Fütter' die Kerne!
Mit der dritten Evolutionsstufe von Bulldozer, Codename Steamroller, weicht AMD das Modulprinzip weiter auf und verspricht beispielsweise ein besseres Frontend. Dieses sitzt vor den eigentlichen Rechenkernen (eine Gleitkomma- plus zwei Integer-Einheiten) und bereitet die nötigen Daten vor, etwa die Dekodierung von Instruktionen. Bei Bulldozer und Piledriver steht pro Modul nur ein Dekoder für alle drei Rechenkerne zur Verfügung, im Falle von Steamroller sind es zwei. Weiterhin wurde die Heranschaffung von Befehlen (Fetch) beschleunigt, dazu kommt eine Verbesserung des L1-Instruction-Caches sowie der wichtigen Sprungvorhersage. Am Ende sollen hier 30 Prozent mehr Operationen pro Takt abgearbeitet werden, was das "Füttern" der Kerne drastisch beschleunigen dürfte.
Singlethread-Leistung und Performance/Watt steigen
Neben diesen Verbesserung hat AMD auch die Integer-Einheiten an sich getunt, hierdurch soll die Singlethread-Leistung steigen. Der Scheduler soll fünf bis zehn Prozent flotter arbeiten und dem L1-Daten-Cache will der Hersteller große Verbesserungen spendiert haben. Obendrein fassen die Register mehr Daten, die Latenzen wurden verschärft und Cache-Fehlzugriffe sollen flotter ad acta gelegt werden.
Durch die Änderungen am Fetch-Bereich, der Gleitkomma-Einheit sowie dem L2-Cache soll nicht nur die Leistung steigen, sondern auch der Durchsatz - womit die Architektur effizienter arbeitet, sprich der Durchsatz wurde optimiert und das Performance-pro-Watt-Verhältnis steigt. AMD spricht in der an uns geschickten Email von einer bis zu 15-prozentigen Verbesserung gegenüber Piledriver. Hierbei ist jedoch bereits eingerechnet , dass die Fertigung vom 32- auf das 28-Nanometer-Verfahren wechselt.
Alles in allem die oben zu sehende Folie vom Financial Analyst Day aus dem Februar 2012 damit wie gehabt ziemlich treffend.
2013 als Kaveri und später "among others"
Die Steamroller-Technik soll 2013 in Form von Kaveri (ein oder zwei Module plus "Graphics Core Next"-Grafikeinheit) auf den Markt kommen, für 2014 könnte eine neue FX- oder eine entsprechende Server-Generation erscheinen - letzteres ist durch Folien vom Financial Analyst Day 2012 praktisch bestätigt, wenngleich keine Codenamen bekannt sind. AMD selbst aber sieht Steamroller auch für weitere Chips vor.

Die Feind"religion" wird dann natürlich gehasst.