Bulldozer - 20 Fragen von AMD beantwortet: Module, Turbo und mehr

30
News Marc Sauter Als bevorzugte Quelle auf Google hinzufügen

Im Bulldozer-Blog hat AMDs John Fruehe sich 20 Fragen zu Bulldozer, Bobcat und Co. vorgenommen und in zwei Blogs beantwortet. PC Games Hardware fasst die interessantesten Aussagen zusammen.

Seit Anfang August informiert AMD in seinem Bulldozer-Blog über die kommende CPU-Generation. John Fruehe, Director of Product Marketing for Server and Workstation, forderte die Leser auf, 20 Fragen (mit Fokus auf Server) an ihn zu schicken. Mittlerweile sind diese in zwei Runden beantwortet worden.

Die erste Frage bezieht sich auf den Unterschied zwischen Kernen und Modulen. Zur Erinnerung: Ein Bulldozer-Modul beherbergt zwei per klassischem CMP arbeitende Integer-Kerne, die sich L2-Cache und FPU teilen - jeder aber nutzt seinen eigenen L1-Daten-Cache und Ausführungseinheiten. AMD spricht von zwei (Integer-)Kernen, wenngleich ein Modul nur rund 80 Prozent der Leistung eines Dualcores erreicht. So weit, so Hot Chips. AMD wird laut Fruehe den Begriff Module nur im Zusammenhang mit Bulldozer nennen, vermarktet wird die CPU aber in Kernen - ein fiktiver Phenom III mit vier Modulen ist daher ein Octacore.

Dazu passend auch die Frage danach, ob eine Dualthreaded-Applikation auf einem Modul besondere Optimierungen erlaubt - also "Paare" pro Modul laufen zu lassen. Fruehe merkt an, dass hier in erster Linie der OS-Scheduler gefragt ist und das im Zweifel die Applikation in zwei Modulen statt einem schneller läuft (80 Prozent!). Da der L2-Cache zwischen beiden Integer-Kernen aufgeteilt ist, kann immer nur einer schreiben. Wenn aber beide Threads sich Daten im L2 teilen, gibt es Leistungsplus - andere Kerne können währenddessen zum Strom sparen in den idle-Modus versetzt werden. Wenn jedoch andere Module frei sind und die Anwendung nicht extrem auf L2/L3-Cache-Nutzung abzielt, ist es sinnvoll diese Module mit Arbeit zu versorgen. Fruehe kommt daher zu dem Fazit, dass beide Optionen ihre Vorteile haben und gegeneinander abgewogen werden sollten. AMD sieht die Modul-Bauweise in Front, da sie 80 Prozent eines DCs bei niedrigerer Leistungsaufnahme, Die-Space und Kosten liefert.

Interessant ist die Frage nach der "Turbocore"-Technologie von Bulldozer. Intel etwa hat seinen "Turboboost" vom Bloomfield zum Lynnfield hin verbessert und Sandy Bridge wird dies fortsetzen. Bulldozer soll gegenüber Thuban (Phenom II X6) ebenfalls einen überarbeiteten Turbo erhalten, auch die Server-Versionen sind damit ausgestattet. Fruehe spricht von einem "big boost" in Singlethreaded-Applikationen und auch für "heavier workloads" seien interessante Einsatzmöglichkeiten gegeben. Wir deuten diese Aussage dahingehend, dass auch AMD den Turbo effektiver gestaltet.

Auch geht Fruehe auf die Stromsparmechanismen ein, welche man aufgrund des neuen Designs von Anfang an mit besonderem Augenmerk implementiert hat. Von Beginn an sei Bulldozer energieeffizient, Optimierungen bei geteilten Ressourcen, Taktraten und Power Gating sollen den Bulldozer besonders sparsam machen. Neben neuen Features sind aber auch bekannte wie Power Now! und Low-Voltage-DDR3-Support mit von der Partie. Fruehe benennt hier CPUs, die mit 33 Prozent mehr Kernen und größeren Caches im gleichen Leistungsaufnahmenbereich wie ein 12-Kern-Prozessor seien. 33 Prozent mehr Kerne sind hier aber 16 Integer-Cores (acht Module), die 80-Prozent-Regel würde daher 12,8 echte Kerne ergeben - die Caches außen vor. Es bleibt also abzuwarten, wie effizient Bulldozer wirklich zu Werke geht.

Quelle: http://blogs.amd.com/work/category/bulldozer/

Bildergalerie

30
    • Kommentare (30)

      Zur Diskussion im Forum
      • Von bofferbrauer Volt-Modder(in)
        Zitat von Superwip
        Das halte ich für einen Fehler, da Intels Sandy Bridge CPUs bei gleicher Kernanzahl wohl immer schneller sein werden; vergleicht man jedoch etwa einen 4 Modul BD mit einem 4 Kern SB sieht die Welt meist wahrscheinlich schon anders aus
        Könnte fürs Marketing allerdings eine echte Goldgrube sein. Erinnert euch nur mal an Pentium 4 Zeiten. Wer's nicht besser wusste, kaufte einen P4 weil er ja mehr MHz hat; ergo auf den ersten Blick durchaus mehr Leistung, obwohl der langsamer getaktete Athlon schneller war. Vielleicht hat AMD dabei nur seine lektion gelernt und dann nur noch die MHz durch multicores ersetzt. Von Vorteil wäre natürlich, wenn er auch ohne solche Tricks schneller wär als ein vergleichbares Intel-Pendant. Hoffen wir einfach das beste

        Zitat von olol
        ich denke dass wird so wie aktuell bei intels smt und windows 7 sein, also dass das betriebssystem automatisch bei weniger als 4 threads nur jedem modul einen zuteilt, so hätte man mindestens 10% ipc mehr(bei 2 threads pro modul 180% leistung daher jeder core nur 90%)
        Das geht aber nur, weil man Windows beigebracht hat, zwischen reellen und virtuellen kernen zu unterscheiden. Hier sind jedoch alle kerne "echt", virtuelle kerne sind da nicht bei. Hoffen wir also, dass Windows auch demzufolge verbessert wird und zwischen (einzel)kernen, virtuellen kernen und modularen kernen immer korrekt unterscheiden unterscheiden kann und die richtige Wahl trifft.

        P.S. Bin mal gespannt wie lang es dauert, bis beide techniken vereint werden und wir einen modularen Chip mit SMT haben. Dann kann das Gigatreads-rennen ja endlich beginnen
      • Von bofferbrauer Volt-Modder(in)
        Zitat von Superwip
        Das halte ich für einen Fehler, da Intels Sandy Bridge CPUs bei gleicher Kernanzahl wohl immer schneller sein werden; vergleicht man jedoch etwa einen 4 Modul BD mit einem 4 Kern SB sieht die Welt meist wahrscheinlich schon anders aus
        Könnte fürs Marketing allerdings eine echte Goldgrube sein. Erinnert euch nur mal an Pentium 4 Zeiten. Wer's nicht besser wusste, kaufte einen P4 weil er ja mehr MHz hat; ergo auf den ersten Blick durchaus mehr Leistung, obwohl der langsamer getaktete Athlon schneller war. Vielleicht hat AMD dabei nur seine lektion gelernt und dann nur noch die MHz durch multicores ersetzt. Von Vorteil wäre natürlich, wenn er auch ohne solche Tricks schneller wär als ein vergleichbares Intel-Pendant. Hoffen wir einfach das beste

        Zitat von olol
        ich denke dass wird so wie aktuell bei intels smt und windows 7 sein, also dass das betriebssystem automatisch bei weniger als 4 threads nur jedem modul einen zuteilt, so hätte man mindestens 10% ipc mehr(bei 2 threads pro modul 180% leistung daher jeder core nur 90%)
        Das geht aber nur, weil man Windows beigebracht hat, zwischen reellen und virtuellen kernen zu unterscheiden. Hier sind jedoch alle kerne "echt", virtuelle kerne sind da nicht bei. Hoffen wir also, dass Windows auch demzufolge verbessert wird und zwischen (einzel)kernen, virtuellen kernen und modularen kernen immer korrekt unterscheiden unterscheiden kann und die richtige Wahl trifft.

        P.S. Bin mal gespannt wie lang es dauert, bis beide techniken vereint werden und wir einen modularen Chip mit SMT haben. Dann kann das Gigatreads-rennen ja endlich beginnen
      • Von olol PC-Selbstbauer(in)
        Zitat von PCTom
        wenn ein Modul 80% der Leistung eines DC hat wie wird es dann mit Programmen die z.B nur bis zu 3 Kernen nutzen werden die dann 3 Module oder Kerne nutzen, bei Kernen würde das ein Leistungsminus bedeuten es sei den der neue Turbocore könnte das wieder auffangen ???
        ich denke dass wird so wie aktuell bei intels smt und windows 7 sein, also dass das betriebssystem automatisch bei weniger als 4 threads nur jedem modul einen zuteilt, so hätte man mindestens 10% ipc mehr(bei 2 threads pro modul 180% leistung daher jeder core nur 90%)
      • Von Superwip Lötkolbengott/-göttin
        Zitat
        Die So1366-Ablösung wird afaik erst für den Sommer erwartet, d.h. Bulldozer könnte fast ein halbes Jahr gegen Gulftown antreten.
        Bulldozer wird doch auch erst für den Sommer erwartet oder hab ich was verschlafen?
      • Von ruyven_macaran Trockeneisprofi (m/w)
        Zitat von XE85
        nur wird Gulftown nicht unbedingt der primäre Gegner sein - hält intel sein Roadmap ein werden das wohl 6 und 8 Kern SB Modelle sein
        Die So1366-Ablösung wird afaik erst für den Sommer erwartet, d.h. Bulldozer könnte fast ein halbes Jahr gegen Gulftown antreten.

        Zitat von PhenomII-Fan
        Die AMDische Variante heißt CMT → Clustered Multithreading und es sieht verdammt danach aus, dass es wesentlich besser sein wird, als Intels Simultaneous Multithreading.
        Naja - nach aktuellem Stand der Dinge wird AMD aber deutlich weniger CMT-Module unterbringen, als Intel HT-Cores. Das ist eher Brute Force denn Effizienzsteigerung und imho kaum mit SMT zu vergleichen. Eine Bulldozermodul ähnelt imho eher einem ganz kleinen Core2 (E4 oder so), dem man die zweite FPU geklaut hat. Ein Bulldozer würde damit zu einem abgespeckten Dunnington mit IMC werden...
      • Von XE85 Lötkolbengott/-göttin
        CMT kann man aber nicht mit SMT vergleichen, ein 4Modul(8 Kern) BD wird "nur" 8Threads gleichzeitig bearbeiten können und nicht 16 wie ein 8Kern Sandy Bridge mit SMT

        mit den 80% Leistungssteigerung meint AMD die Steigerung eines Moduls gegenüber einem Kern, sprich ein Modul ist 1,8mal so schnell wie ein Kern - im optimalfall natürlich, 2 Kerne wären 2mal so schnell

        ein 4Modul BD soll also laut AMD die Performance eines 7,2 Kerners haben

        mfg
      Direkt zum Diskussionsende
  • Print / Abo
    Apps
    PCGH Magazin 07/2026 PC Games 07/2026 play5 07/2026 N-Zone 07/2026 Linux Magazin 07/2026 LinuxUser 07/2026 Raspberry Pi Geek 07/2026
    PC Games Hardware PC Games Linux Magazin Raspberry Pi Geek Computec Kiosk