AMDs Bulldozer [Quelle: siehe Bildergalerie]
Seit Anfang August informiert AMD in seinem Bulldozer-Blog über die kommende CPU-Generation. John Fruehe, Director of Product Marketing for Server and Workstation, forderte die Leser auf, 20 Fragen (mit Fokus auf Server) an ihn zu schicken. Mittlerweile sind diese in zwei Runden beantwortet worden.
Die erste Frage bezieht sich auf den Unterschied zwischen Kernen und Modulen. Zur Erinnerung: Ein Bulldozer-Modul beherbergt zwei per klassischem CMP arbeitende Integer-Kerne, die sich L2-Cache und FPU teilen - jeder aber nutzt seinen eigenen L1-Daten-Cache und Ausführungseinheiten. AMD spricht von zwei (Integer-)Kernen, wenngleich ein Modul nur rund 80 Prozent der Leistung eines Dualcores erreicht. So weit, so
Hot Chips. AMD wird laut Fruehe den Begriff Module nur im Zusammenhang mit Bulldozer nennen, vermarktet wird die CPU aber in Kernen - ein fiktiver Phenom III mit vier Modulen ist daher ein Octacore.
Dazu passend auch die Frage danach, ob eine Dualthreaded-Applikation auf einem Modul besondere Optimierungen erlaubt - also "Paare" pro Modul laufen zu lassen. Fruehe merkt an, dass hier in erster Linie der OS-Scheduler gefragt ist und das im Zweifel die Applikation in zwei Modulen statt einem schneller läuft (80 Prozent!). Da der L2-Cache zwischen beiden Integer-Kernen aufgeteilt ist, kann immer nur einer schreiben. Wenn aber beide Threads sich Daten im L2 teilen, gibt es Leistungsplus - andere Kerne können währenddessen zum Strom sparen in den idle-Modus versetzt werden. Wenn jedoch andere Module frei sind und die Anwendung nicht extrem auf L2/L3-Cache-Nutzung abzielt, ist es sinnvoll diese Module mit Arbeit zu versorgen. Fruehe kommt daher zu dem Fazit, dass beide Optionen ihre Vorteile haben und gegeneinander abgewogen werden sollten. AMD sieht die Modul-Bauweise in Front, da sie 80 Prozent eines DCs bei niedrigerer Leistungsaufnahme, Die-Space und Kosten liefert.
Interessant ist die Frage nach der "Turbocore"-Technologie von Bulldozer. Intel etwa hat seinen "Turboboost" vom Bloomfield zum Lynnfield hin verbessert und Sandy Bridge wird dies fortsetzen. Bulldozer soll gegenüber Thuban (Phenom II X6) ebenfalls einen überarbeiteten Turbo erhalten, auch die Server-Versionen sind damit ausgestattet. Fruehe spricht von einem "big boost" in Singlethreaded-Applikationen und auch für "heavier workloads" seien interessante Einsatzmöglichkeiten gegeben. Wir deuten diese Aussage dahingehend, dass auch AMD den Turbo effektiver gestaltet.
Auch geht Fruehe auf die Stromsparmechanismen ein, welche man aufgrund des neuen Designs von Anfang an mit besonderem Augenmerk implementiert hat. Von Beginn an sei Bulldozer energieeffizient, Optimierungen bei geteilten Ressourcen, Taktraten und Power Gating sollen den Bulldozer besonders sparsam machen. Neben neuen Features sind aber auch bekannte wie Power Now! und Low-Voltage-DDR3-Support mit von der Partie. Fruehe benennt hier CPUs, die mit 33 Prozent mehr Kernen und größeren Caches im gleichen Leistungsaufnahmenbereich wie ein 12-Kern-Prozessor seien. 33 Prozent mehr Kerne sind hier aber 16 Integer-Cores (acht Module), die 80-Prozent-Regel würde daher 12,8 echte Kerne ergeben - die Caches außen vor. Es bleibt also abzuwarten, wie effizient Bulldozer wirklich zu Werke geht.
Quelle:
http://blogs.amd.com/work/category/bulldozer/
Alle Artikel zu
CPUs und Prozessoren von Intel und AMD finden Sie auf der CPU-Themenseite. Eine aktuelle Prozessor-Kaufberatung finden Sie im Artikel
Intel- und AMD-CPUs: Test-Übersicht und aktuelle Kauf-Tipps. Mehr zum
Phenom-Entwickler AMD und
Core-Entwickler Intel erfahren Sie in unseren Themen-Specials.
PC-Selbstbauer
04.09.2010 04:12
Könnte fürs Marketing allerdings eine echte Goldgrube sein. Erinnert euch nur mal an Pentium 4 Zeiten. Wer's nicht besser wusste, kaufte einen P4 weil er ja mehr MHz hat; ergo auf den ersten Blick durchaus mehr Leistung, obwohl der langsamer getaktete Athlon schneller war. Vielleicht hat AMD dabei nur seine lektion gelernt und dann nur noch die MHz durch multicores ersetzt. Von Vorteil wäre natürlich, wenn er auch ohne solche Tricks schneller wär als ein vergleichbares Intel-Pendant. Hoffen wir einfach das beste
Das geht aber nur, weil man Windows beigebracht hat, zwischen reellen und virtuellen kernen zu unterscheiden. Hier sind jedoch alle kerne "echt", virtuelle kerne sind da nicht bei. Hoffen wir also, dass Windows auch demzufolge verbessert wird und zwischen (einzel)kernen, virtuellen kernen und modularen kernen immer korrekt unterscheiden unterscheiden kann und die richtige Wahl trifft.
P.S. Bin mal gespannt wie lang es dauert, bis beide techniken vereint werden und wir einen modularen Chip mit SMT haben. Dann kann das Gigatreads-rennen ja endlich beginnen
PC-Selbstbauer
04.09.2010 02:45
ich denke dass wird so wie aktuell bei intels smt und windows 7 sein, also dass das betriebssystem automatisch bei weniger als 4 threads nur jedem modul einen zuteilt, so hätte man mindestens 10% ipc mehr(bei 2 threads pro modul 180% leistung daher jeder core nur 90%)
BIOS-Overclocker
04.09.2010 02:22
Bulldozer wird doch auch erst für den Sommer erwartet oder hab ich was verschlafen?