Bulldozer - 20 Fragen von AMD beantwortet: Module, Turbo und mehr
Im Bulldozer-Blog hat AMDs John Fruehe sich 20 Fragen zu Bulldozer, Bobcat und Co. vorgenommen und in zwei Blogs beantwortet. PC Games Hardware fasst die interessantesten Aussagen zusammen.
Seit Anfang August informiert AMD in seinem Bulldozer-Blog über die kommende CPU-Generation. John Fruehe, Director of Product Marketing for Server and Workstation, forderte die Leser auf, 20 Fragen (mit Fokus auf Server) an ihn zu schicken. Mittlerweile sind diese in zwei Runden beantwortet worden.
Die erste Frage bezieht sich auf den Unterschied zwischen Kernen und Modulen. Zur Erinnerung: Ein Bulldozer-Modul beherbergt zwei per klassischem CMP arbeitende Integer-Kerne, die sich L2-Cache und FPU teilen - jeder aber nutzt seinen eigenen L1-Daten-Cache und Ausführungseinheiten. AMD spricht von zwei (Integer-)Kernen, wenngleich ein Modul nur rund 80 Prozent der Leistung eines Dualcores erreicht. So weit, so Hot Chips. AMD wird laut Fruehe den Begriff Module nur im Zusammenhang mit Bulldozer nennen, vermarktet wird die CPU aber in Kernen - ein fiktiver Phenom III mit vier Modulen ist daher ein Octacore.
Dazu passend auch die Frage danach, ob eine Dualthreaded-Applikation auf einem Modul besondere Optimierungen erlaubt - also "Paare" pro Modul laufen zu lassen. Fruehe merkt an, dass hier in erster Linie der OS-Scheduler gefragt ist und das im Zweifel die Applikation in zwei Modulen statt einem schneller läuft (80 Prozent!). Da der L2-Cache zwischen beiden Integer-Kernen aufgeteilt ist, kann immer nur einer schreiben. Wenn aber beide Threads sich Daten im L2 teilen, gibt es Leistungsplus - andere Kerne können währenddessen zum Strom sparen in den idle-Modus versetzt werden. Wenn jedoch andere Module frei sind und die Anwendung nicht extrem auf L2/L3-Cache-Nutzung abzielt, ist es sinnvoll diese Module mit Arbeit zu versorgen. Fruehe kommt daher zu dem Fazit, dass beide Optionen ihre Vorteile haben und gegeneinander abgewogen werden sollten. AMD sieht die Modul-Bauweise in Front, da sie 80 Prozent eines DCs bei niedrigerer Leistungsaufnahme, Die-Space und Kosten liefert.
Interessant ist die Frage nach der "Turbocore"-Technologie von Bulldozer. Intel etwa hat seinen "Turboboost" vom Bloomfield zum Lynnfield hin verbessert und Sandy Bridge wird dies fortsetzen. Bulldozer soll gegenüber Thuban (Phenom II X6) ebenfalls einen überarbeiteten Turbo erhalten, auch die Server-Versionen sind damit ausgestattet. Fruehe spricht von einem "big boost" in Singlethreaded-Applikationen und auch für "heavier workloads" seien interessante Einsatzmöglichkeiten gegeben. Wir deuten diese Aussage dahingehend, dass auch AMD den Turbo effektiver gestaltet.
Auch geht Fruehe auf die Stromsparmechanismen ein, welche man aufgrund des neuen Designs von Anfang an mit besonderem Augenmerk implementiert hat. Von Beginn an sei Bulldozer energieeffizient, Optimierungen bei geteilten Ressourcen, Taktraten und Power Gating sollen den Bulldozer besonders sparsam machen. Neben neuen Features sind aber auch bekannte wie Power Now! und Low-Voltage-DDR3-Support mit von der Partie. Fruehe benennt hier CPUs, die mit 33 Prozent mehr Kernen und größeren Caches im gleichen Leistungsaufnahmenbereich wie ein 12-Kern-Prozessor seien. 33 Prozent mehr Kerne sind hier aber 16 Integer-Cores (acht Module), die 80-Prozent-Regel würde daher 12,8 echte Kerne ergeben - die Caches außen vor. Es bleibt also abzuwarten, wie effizient Bulldozer wirklich zu Werke geht.
Quelle: http://blogs.amd.com/work/category/bulldozer/

P.S. Bin mal gespannt wie lang es dauert, bis beide techniken vereint werden und wir einen modularen Chip mit SMT haben. Dann kann das Gigatreads-rennen ja endlich beginnen
mit den 80% Leistungssteigerung meint AMD die Steigerung eines Moduls gegenüber einem Kern, sprich ein Modul ist 1,8mal so schnell wie ein Kern - im optimalfall natürlich, 2 Kerne wären 2mal so schnell
ein 4Modul BD soll also laut AMD die Performance eines 7,2 Kerners haben
mfg