Der Pentium als Grafikchip: Intel enthüllt Larrabee: Architekturdetails
In einer Telefonkonferenz verriet Intel etwas mehr über das mysteriöse Larrabee-Projekt - wir fassen die bekannten Details zu jenem Chip zusammen, der gegen Radeon und Geforce antritt, aber dank Tera-FLOPS an Rechenleistung noch viel mehr können soll - unter anderem Raytracing.
Quelle: pc.watch.impress.co.jp
Das Larrabee-Blockdiagramm bestätigt das durchgesickerte Bild von vor über einem Jahr.
Larrabee im Detail
"Larrabee basiert auf dem alten Pentium": Dieses Gerücht geistert seit ein paar Wochen durchs Netz. Und wie so oft steckt viel Wahrheit dahinter, denn wie Intel es formuliert, wurden die einzelnen Larrabee-Kerne tatsächlich vom alten Pentium-Design abgeleitet, wahrscheinlich vom P54C aus dem Jahre 1994. Das wäre durchaus sinnvoll: Die Kerne müssen x86-Code verarbeiten können, brauchen allerdings nicht die Komplexität und Performance aktueller Core-Prozessoren; dazu müssen sie klein und sparsam genug sein, um sich zwanzig- oder dreißigfach in einem Chip vereinen zu lassen. Der Pentium, produziert mit heutigen Methoden, erfüllt diese Auflagen.
Dennoch gibt es bedeutende Unterschiede zwischen einem einzelnen Larrabee-Kern und dem Pentium 1, auch wenn seine Architektur mitsamt der kurzen fünfstufigen Pipeline in Grundzügen übernommen wurde. Den L1-Cache etwa hat Intel von 16 auf 64 KiByte erweitert (jeweils 32 KiByte für Daten und Instruktionen), jedem Kern stehen überdies 256 KiByte L2-Cache zur Verfügung, die vermutlich mit der Taktfrequenz des Kerns laufen - der Pentium besaß noch keinen eigenen L2-Cache, dieser befand sich seinerzeit noch auf dem Mainboard.
Selbstverständlich bringt die Neuauflage auch zeitgemäßen 64-Bit-Support mit. Out-of-order-Execution, wie sie bei heutigen CPUs außer Intels Atom selbstverständlich ist, beherrscht der Pentium und damit auch der Larrabee nicht. Weitgehend ausgleichen soll dies verbessertes Prefetching ebenso wie das vierfache Hyperthreading (SMT, Simultaneous Multithreading), mit dem jeder Kern vier Threads zugleich bearbeiten kann; durch die weitere Unterteilung in sogenannte Microthreads lässt sich die Thread-Zahl weiter erhöhen.
Quelle: pc.watch.impress.co.jp
Intel verspricht für Larrabee fast lineare Skalierung mit der Kernzahl auch in Spielen.
Natürlich werden Larrabee-Kerne nicht wie damals mit 500 Nanometern, sondern im modernen 45-Nanometer-Prozess gefertigt. Das ist auch nötig, um die Leistungsaufnahme im Zaum zu halten und um mehrere Kerne im Gehäuse unterzubringen. Wie viele es sein werden, will man noch nicht verraten; im Interview sprach Dr. Michael Vollmer von Intel (siehe PCGH 09/2008) nur von einer Kernzahl "zwischen 4 und 80". Neue Skalierungsbenchmarks geben die angebliche Performance mit 8 bis 64 Kernen an, jedoch stets mit Vielfachen von 8; die erste Larrabee-Version wird vermutlich aus 24 oder 32 Kernen bestehen. Zur Taktfrequenz war noch nichts zu erfahren, Gerüchte sprechen von bis zu 2 GHz. Übrigens sollen sich auch mehrere Larrabee-GPUs kombinieren lassen, und das relativ problemlos - konkrete Pläne für einen Multi-GPU-SLI-/Crossfire-Konkurrenten gibt es jedoch noch nicht.
Die einzelnen Kerne werden über einen Ringbus mit einer Breite von 1.024 Bit verbunden (512 Bit in jeder Richtung), wie ihn auch AMD für die Radeon HD 2900 verwendete - ob das für 32 Kerne oder sogar mehr reicht, wird sich zeigen. Der Ringbus ist jedoch nicht zu verwechseln mit dem Speicherinterface, zu dem Intel keine genaueren Angaben macht: Der Speicher werde über ein "übliches" Interface angebunden, also vermutlich über eine Breite von 128 oder 256 Bit. In Kombination mit schnellem GDDR5-RAM sollte das reichen.
