Online-Abo
  • Login
  • Registrieren
Games World
  • Die PCGH-CPU-Historie: Heute mit Sockel 1156 und 1366

    Im Verlauf dieser Serie möchten wir die wichtigsten CPU-Meilensteine seit Ende des letzten Jahrtausends vorstellen. Diese Woche: Integration bei Intel mit den Sockeln 1156 und 1366.


    Optimierungen am Kern, integrierter Speichercontroller (IMC), vier Kerne auf einem DIE, Punkt-zu-Punkt-Verbindung zum Chipsatz, gemeinsamer L3-Cache und getrennte L2-Caches - die Neuerungen, die Intel am 18. November 2008 vorstellt, erinnert an AMDs K8- und K10-Einführung. Tatsächlich sind es die gleichen Gründe, die Intel nach 37 Jahren zur Abkehr vom Front-Side-Bus zwingen: Die für weitere Taktsteigerungen nötige Signalqualität ließe sich nur mit großem Aufwand erreichen, eine Steigerung der Busbreite über die seit dem Pentium 1 verwendeten 64 Bit stellt extreme Anforderungen an Routing und Sockel und die hohen Latenzen bei Speicherzugriffen lassen sich gar nicht vermeiden. Die spezifische Implementation der Lösungsansätze unterscheidet sich jedoch von AMD.

    Der Sockel 1366 erhielt einen Metallrahmen um das eigentliche Kontaktfeld und eine eigene Backplate auf der Rückseite, um die Stabilität zu steigern. Tatsächlich erzeugen Kühler, die sich an die Intel-Spezifikationen halten, nicht einmal ein Drittel des gesamten Anpressdruckes - der Rest wird vom Sockelmachanismuss aufgebracht. Der Sockel 1366 erhielt einen Metallrahmen um das eigentliche Kontaktfeld und eine eigene Backplate auf der Rückseite, um die Stabilität zu steigern. Tatsächlich erzeugen Kühler, die sich an die Intel-Spezifikationen halten, nicht einmal ein Drittel des gesamten Anpressdruckes - der Rest wird vom Sockelmachanismuss aufgebracht. Quelle: PC Games Hardware So nutzt der neue Sockel 1366 die Integration des Speichercontrollers auch zu einer deutlichen Bandbreitensteigerung in Form eines dritten Speicherkanals. Statt zuletzt 333 bis 400 MHz und vier Bit pro Takt beim Front Side Bus ergeben sich so dreimal 533 MHz (ebenfalls bei je 64 Bit) im DDR Verfahren - die Bandbreite hat sich mehr als verdoppelt und steht jetzt exklusiv für Speicherzugriffe zur Verfügung, dazu kommen die gesunken Zugriffslatenz (45 statt 68 ns) durch die direkte Anbindung des Speichercontroller an die CPU.

    Die Verbindung zum Chipsatz und damit zu den Grafikkarten läuft separat über QPI ("Quick PathInterconnect"). Ähnlich wie AMDs HyperTransport arbeitet QPI paketorientiert im DDR Verfahren als Punkt-zu-Punktverbindung mit getrennten Leitungen für beide Richtungen. So lassen sich nur noch zwei Geräte verbinden (FSB in der Praxis: bis zu 4 CPUs und ein Chipsatz), im Gegenzug ist der Aufbau einfacher, damit bei hohen Taktraten zuverlässiger und die verfügbare Bandbreite muss nicht geteilt werden. Dank des höheren Taktes kann man auch mit einer geringeren Interface-Breite arbeiten und so den Synchronisationsaufwand zwischen mehreren Leitungen reduzieren.
    Hier beginnen auch die Unterschiede zu HyperTransport. AMD CPUs arbeiten mit einem 16 Bit Link pro Richtung, wird QPI dagegen ist weiter in vier "Quadranten" mit je 5 Leitungen unterteilt, dazu kommt eine separate Taktleitung. Eine Fehlerkorrektur ist direkt auf Paketebene integriert, so dass ein 80 Bit "Flit", der in zwei DDR-Taktzyklen über die 20 Datenleitungen wandert, 64 Bit Nutzdaten enthält. Bei 3,2 GHz (nur Extreme-Versionen, sonst 2,4 GHz) ergeben sich 12,8 GB pro Sekunde und Richtung - exakt die gleiche Bandbreite, die der Front Side Bus unidirektional bot, diesmal aber ohne zusätzliche Last durch Speicherzugriffe. (Im Gegenzug müssen DMA-Zugriffe von Komponenten auf den Speicher über den Umweg CPU erfolgen)

    Im inneren des eigentlichen CPU-Kerns werden weitere Unterschiede deutlich. Der neue "Bloomfield"-Kern aus der "Nehalem"-Familie nutzt, ähnlich wie AMDs Phenom, einen großen L3-Cache für alle Kerne und die Kommunikation zwischen ihnen. Dieser wird aber, wie bei allen Intel CPUs, inklusive ausgeführt. Das heißt alle Daten, die sich in einem der L2-Cache befinden, liegen als Kopie auch im L3-Cache vor. Der Vorteil: Die Verwaltung wird einfacher und Cache-Zugriffe schneller (die Latenzen liegen mittig zwischen denen eines Core-2-L2-Cache und eines Phenom-II-L3-Cache). Vor allem muss bei ein Kern nach einem cache-miss im eigenen L2-Cache nur noch im L3-Cache nachgucken und nicht die L2-Caches anderer Kerne durchsuchen. Der Nachteil ist ebenso deutlich: Die L2-Caches verringern nur Zugriffslatenzen, stellen aber keinen zusätzlichen Speicherplatz dar. Entsprechend klein fallen sie mit 256 KiB aus (Unter Intels-Oberklasse-CPUs zuvor nur beim jeweils ersten Pentium II, III und 4). Intel investiert das Transistorbudget lieber in einen 8 MiB großen L3-Cache. Damit steht ähnlich viel Platz zur Verfügung, wie bei AMDs späteren Phenom II, aber je nach Art des Zugriffes liegt der Latenzvorteil mal bei der einen und mal bei der anderen Architektur.

    Eine weitere Neuerung im CPU-Kern ist die Takt- und Spannungsregelung, die jetzt ein eigenständiger Controller übernimmt. Dieser regelt nicht nur jeden Kern einzeln herunter, sondern kann sie sogar leicht um 133 MHz übertakten, wenn die gesamte CPU noch Abstand zu ihrem 130-WTDP-Limit hat.

    In den Recheneinheiten findet sich dagegen kaum Neues (der SSE-Befehlssatz wird von 4.1 auf 4.2 erweitert), aber die Rückkehr von Altem.SimultaneousMultithreading, also die Fähigkeit eines Kerns, zwei Threads zeitgleich anzunehmen, wurde bereits 2002 für den Pentium 4 eingeführt, verschwand mit dem Ende der Netburst-Architektur aber wieder. Bei Nehalem trifft es nun auf einen leistungsfähigen Rechenkern nach Core-2-Vorbild. Dessen kürzere Pipeline hat es, zwar seltener nötig, Befehle eines anderen Threads "zwischenzuschieben", aber dank dem leistungsfähigen 4-fach-skalaren Decoders kann er es auch leichter. Anfangs gibt es Probleme mit dem Betriebssystem, dass manchmal beide logischen Kerne eines realen Kernes mit Arbeit überhäuft, während andere reale Kerne leerlaufen, doch dank der steigenden Zahl von Multithread optimierten Anwendungen liegen die Vorteile von HyperThreading diesmal nicht nur in einem verbesserten Ansprechverhalten (das eine Multi-Core-CPU auch so bietet), sondern -außerhalb von Spielen- auch in einer klaren Leistungssteigerung, die mit anderen Methoden nur zu höheren Kosten hätte erzielt werden können.

    Der Sockel-1366 auch für den Workstation-Markt entwickelt. Eine Southbridge stellt PCI, PCI-Express-x1-Lanes und externe Schnittstellen bereit. Über DMI ist sie an einen PCI-Express-2.0-Controller angeschlossen, der beispielsweise Grafikkarten anbindet. Dieser hängt seinerseits über QPI (entwickelt als CSI, 'Common Serial Interface', da es auch für die Quad-CPU- Plattform Sockel-1567 und den Itanium verwendet wird) an einem oder zwei CPUs und RAM. Die addierte Bandbreite der PCI-E Lanes übersteigt die der QPI-Verbindung übrigens um das 1,5 fache. Der Sockel-1366 auch für den Workstation-Markt entwickelt. Eine Southbridge stellt PCI, PCI-Express-x1-Lanes und externe Schnittstellen bereit. Über DMI ist sie an einen PCI-Express-2.0-Controller angeschlossen, der beispielsweise Grafikkarten anbindet. Dieser hängt seinerseits über QPI (entwickelt als CSI, "Common Serial Interface", da es auch für die Quad-CPU- Plattform Sockel-1567 und den Itanium verwendet wird) an einem oder zwei CPUs und RAM. Die addierte Bandbreite der PCI-E Lanes übersteigt die der QPI-Verbindung übrigens um das 1,5 fache. Quelle: ark.intel.com "Hohe Kosten" sind trotzdem ein auffälliges Merkmal der neuen "Core i7"-Prozessoren auf Nehalem-Basis, denn Intel führt sie als reine High-End-Lösung in den Desktopmarkt ein. Mittel- und Oberklasse bleiben vorerst Sockel-775-Revier. Zudem sind weder der i7-965 XE (3,2 GHz, freier Multiplikator) noch die kleineren i7-920 und -940 einem Preisdruck ausgesetzt. Lediglich in Spielen haben die Core 2 eine Chance, in Anwendungen können selbst die letzten Extreme Editionen nicht mithalten und AMD den Phenom II noch nicht einmal vorgestellt, geschweige denn auf hohe Taktraten gebracht. Entsprechend liegt nur der Preis des kleinsten Modelles mit 284 US-Dollar der CPUs an der Grenze zum erschwinglichen, oberhalb werden 562 beziehungsweise Extreme-typische 999 US-Dollar fällig. Die meisten Aufrüster müssen zusätzlich neuen Speicher erwerben, denn DDR3 wurde bislang selten genutzt und die Boards reißen ein drittes Loch in die Kasse:

    Zum einen zwingt das Triple-Channel-Interface zu teuren 6-Layer-Designs, zum anderen bietet Intel nur die Kombination aus X58 (ohne Speichercontroller eine reine QPIPCI-Express-Bridge) und ICH10 (Southbridge, über das mit PCI-Express verwandte DMI angebunden) als einzigen Chipsatz an. Mit 36 Lanes nach 2.0 Standard und 6 weiteren mit 1.0 Geschwindigkeit ist diese Kombination eindeutig in der Oberklasse zu Hause und wird auf entsprechend teuren Boards verkauft. Auch hier gibt es keine Konkurrenz mehr, denn der Streit zwischen Nvidia und Intel um einen Lizenzaustausch endet damit, dass Nvidia keine QPI-Lizenz erwirbt, umgekehrt aber Mainboardhersteller für SLI-Lizenzen zahlen müssen, damit die Multi-GPU-Technik auf den Oberklasse-Platinen genutzt werden darf. Immerhin verzichtet Nvidia kurzfristig doch noch auf eine Zwangskopplung der Lizenz an den hauseigenen NF200-Switch, wie es sie zu Beginn des Jahres bei Intels Skulltrail-Plattform in Kombination mit dem NF100 gab.

    Wer die Investitionen nicht scheut, der erhält, neben einer ebenfalls sehr hohen Verlustleistung, das bis auf weiteres schnellste System am Markt. Tatsächlich kann sich die Modellpflege für den Sockel 1366 in den nächsten 15 Monaten auf 133 MHz Takterhöhung beim i7-975 XE (3,33 GHz) und entsprechendes Nachrücken der kleineren Modelle beschränken.

    Kaum einem Sockel wurde so viel Aufmerksamkeit zu Teil, wie dem 1156. Kurz nach Erscheinen trat weltweit eine Reihe von Fällen auf, bei denen stark übertaktete, aber auch einige bei normalen Spezifikationen betriebene CPUs zu verschmorten Kontakten und angeschmolzenem Plastik führten. Ursache dieser 'Sockelbrände' war eine fehlerhafte Produktionscharge beim Zulieferer Foxconn, doch es vergingen viele Wochen, bevor das Vertrauen in die Konstruktion wiederhergestellt war. Kaum einem Sockel wurde so viel Aufmerksamkeit zu Teil, wie dem 1156. Kurz nach Erscheinen trat weltweit eine Reihe von Fällen auf, bei denen stark übertaktete, aber auch einige bei normalen Spezifikationen betriebene CPUs zu verschmorten Kontakten und angeschmolzenem Plastik führten. Ursache dieser "Sockelbrände" war eine fehlerhafte Produktionscharge beim Zulieferer Foxconn, doch es vergingen viele Wochen, bevor das Vertrauen in die Konstruktion wiederhergestellt war. Quelle: PC Games Hardware Wesentlich mehr Änderungen erfährt die Core-i-Serie ab September 2009 mit dem Sockel 1155. Dieser soll Nehalem-Technologie auch in Klassen bringen, für die die aufwendige Sockel-1366-Plattform einfach zu teuer wäre. Die Abspeckmaßnahmen bei "Lynnfield" fallen entsprechend radikal aus, sowohl QPI als auch der dritte Speicherkanal gehen verloren. Stattdessen wandert auch die letzte Aufgabe einer Northbridge, die Grafikanbindung, mit einem PCI-Express 2.0 x16 Controller (PEG) in die CPU. Der neue P55-Chipsatz ist nur noch eine Southbridge, die um Basisfunktionen wie die CPU-Ansteuerung erweitert wurde. Im Intel-Jargon wird so aus der MCH/ICH-Kombination ("Memory" beziehungsweise "I/O-Controller-Hub") der Single-Chip PCH (Platform-Controller-Hub). Aus Sicht des Anwenders beschränkt sich der Unterschied zur ICH10-Southbridge in zwei zusätzliche PCI-Express Lanes und bleibt damit weit hinter den Erwartungen zurück. Weder verfügt der neue Chipsatz über Unterstützung für die sich anbahnenden Standards SATA 3 und USB 3, noch bieten seine 8 PCI-Express-Lanes 2.0-Geschwindigkeit, obwohl sie aufgrund von Protokollfeatures als "PCI-E 2.0" beworben werden. Nicht einmal das DMI-Interface wurde beschleunigt, sondern bleibt beim PCI-Express 1.0 x4-Äquivalent von 1 GB pro Sekunde und Richtung.

    Ebenfalls nicht den Erwartungen entsprechend ist die Bezeichnung der CPUs. Statt "Core i5" tragen sie zum Teil ebenfalls das i7-Label der großen Brüder, nur eine 800er Seriennummer weist auf die andere Plattform hin. Als i5-7x0 werden dagegen abgespeckte Versionen mit deaktiviertem HyperThreading verkauft. Sonst kann Lynnfield aber auf das volle Featureset der großen Sockel-1366-Modelle zurückgreifen, nicht einmal die Caches wurden beschnitten und der "Turbomode" sogar deutlich erweitert, so dass jetzt selbstständige Übertaktung um bis zu 533 oder 667 MHz möglich ist. Damit erreicht das Topmodell i7 870 ungefähr die Leistung des ebenfalls mit 2,93 GHz taktenden i7 940 auf Bloomfield-Basis - kostet allerdings auch genauso viel. Für Käufer erschwert sich die Wahl zwischen der billigen, aber spartanischen Sockel-1156-Plattform und dem teuren, erweiterbaren Sockel 1366, somit durch das nur knapp überlappende Leistungs- und Preisspektrum der beiden CPU-Familien.
    In Einem Aspekt kann sich der Sockel 1156 aber als klarer Sieger präsentieren: Ohne stromhungrigen X58 und mit einfacherem Speicherinterface fällt die neue Mittelklasse spürbar sparsamer aus. Unter Last liegt man im Bereich der langsameren Core 2 Quad, im idle-Modus unterbietet man zum Teil sogar AMDs Kombination aus stromspar-Dualcores und effizienten Chipsätzen. Trotzdem ist der Stromverbrauch die einzige Lynnfield-Eigenschaft, an der Intel bis zum Frühsommer 2010 etwas ändert, als im Januar 2010 -s Modelle mit niedrigerer TDP und niedrigerem Standardtakt aber gleich hohem maximalen Turbotakt erscheinen.

    Der größere 45- nm-Chip der Clarkdales wurde vermutlich direkt vom gecancelten Havendale-Projekt übernommen, denn Clarkdale erschien fast ein halbes Jahr früher, als geplant. Das Dual-Chip-Design könnte auf frühere Pläne zurückgehen: Die ersten Gerüchte zur Nehalem-Familie sprachen von einer Sockel-77X-Plattform, die eine klassische Northbridge auf dem Mainboard verwendet. Tatsächlich sind die Speicherlatenzen von Clarkdale genauso hoch, wie die der Sockel-775-Plattform. Der größere 45- nm-Chip der Clarkdales wurde vermutlich direkt vom gecancelten Havendale-Projekt übernommen, denn Clarkdale erschien fast ein halbes Jahr früher, als geplant. Das Dual-Chip-Design könnte auf frühere Pläne zurückgehen: Die ersten Gerüchte zur Nehalem-Familie sprachen von einer Sockel-77X-Plattform, die eine klassische Northbridge auf dem Mainboard verwendet. Tatsächlich sind die Speicherlatenzen von Clarkdale genauso hoch, wie die der Sockel-775-Plattform. Quelle: http://www.intel.de Wesentlich spannender ist eine andere Neuvorstellung des Januars 2010. Mit "Clarkdale" erscheint ein dritter Vertreter der Nehalem-Architektur, der aber nicht mehr zur Nehalem-, sondern zur "Westmere"-Generation gezählt wird. Hinter dieser Bezeichnung verbirgt sich der nächste "Tick" in Intels Tick-Tock-Schema, also eine Kombination der alten Architektur mit einem neuen 32-nm-Fertigungsverfahren. Tatsächlich aber ist der Nehalem-Vorgänger von Clarkdale, der unter dem Namen Havendale entwickelt wurde, nie erschienen und Clarkdale selbst wird zur Hälfte noch in 45 nm hergestellt.

    Diese Mischkonfiguration wird möglich, weil Clarkdale aus zwei, mittels QPI verbundenen, DIEs zusammengesetzt ist. Der 45-nm-Chip enthält die Northbridge-Funktionen, die bereits in Lynnfield integriert waren, und zusätzlich eine integrierte Grafikeinheit. Damit ähnelt der Funktionsumfang einer leicht beschleunigten G45-Northbridge aus Sockel-775-Zeiten. Der 32-nm-Teil ist dagegen eine halbierte Ausgabe der Nehalem-CPUs mit zwei vergleichbaren Kernen, HyperThreading und 4 MiB L3-Cache. Neu hinzugekommen ist die Unterstützung von AES-Instruktionen, die Verschlüsselungsvorgänge beschleunigen sollen.

    Verkauft werden die neuen Chips wie erwartet auch als Core i3 in Form der 500er Serie. Diese weist aber einen weiter beschnittenen Funktionsumfang (kein HT, kein AES, kein Turbomode) auf, noch langsamere Varianten erscheinen als Pentium und Celeron. Die Vollversion dagegen trägt das eigentlich für kleine Lynnfield-Modelle verwendete i5-Label - laut Intel wegen der gleichen Zahl logischer Kerne. Tatsächlich kann der i5 670 als vorerst schnellstes Modell den Anschluss an die kleinsten Lynnfield-Modelle halten, denn dank der neuen Fertigung kann Intel die Taktraten auf 3,46 GHz steigern. Im Turbomode sind sogar 3,73 GHz drin und das alles bei Dual-Core typischen Stromverbräuchen, die zu den niedrigsten am Markt gehören (der Idle-Modus bleibt auf dem sehr guten Lynnfield-Niveau).

    Zwei Monate später, am 18. März, wird die Westmere-"Familie" mit "Gulftown" vervollständigt. Genau wie Clarkdale ersetzt dieser keine CPU der Nehalem-Familie, so dass im Sommer 2010 alle vier Abkömmlinge der Nehalem-Architektur eine gemeinsame Produktpalette bilden (nur bei den Sockel-1567-Groß-Server-CPUs bringt der 32-nm-Tick eine Generationssprung vom Octo-Core Beckton zum Deca-Core Westmere-EX). Die Spitze dieser Palette bilden der Core i7 980X (3,33 GHz) und 970 (3,2 GHz). Diese übernehmen von Clarkdale die 32 nm Fertigung und AES und vom Bloomfield den Sockel 1366 samt Triple-Channel-Interface, den Stromverbrauch, den beschränkten Turbomodus - und die hohen Preise. Neu im Desktopsegment ist dagegen ein 12 MiB großer L3-Cache und sechs reale Kerne. In Anwendungen (und auch knapp im allgemeinen Durchschnitt) erlauben diese dem 980X, bis zum Februar 2011 (dem Erscheinungsdatum des 133 MHz schnelleren 990X) die Leistungskrone zu behalten. In Spielen sind sie vorerst nutzlos, aber da man dank der 32 nm Fertigung den gleichen Takt, wie die schnellsten Bloomfield erreicht, ohne den Stromverbrauch zu steigern, handelt es sich trotzdem klar um die bessere CPU.

    Zugleich ist es eine der letzten mit Nehalem-Architektur, denn abgesehen von leichten Taktsteigerungen in den unteren Klassen, hat Intels Kombination aus Sockel 1156 und 1366 im Jahre 2010 keine Modellpflege nötig, Anfang 2011 wird der 1156 bereits vom 1155 abgelöst. Dessen schnelle Sandy Bridge CPUs berauben auch den meisten 1366-Modellen ihre Daseinsberechtigung, so dass diese Plattform heute ebenfalls im Sterben liegt. Voraussichtlich wird Intel in den kommenden Monaten noch einmal ein Taktupdate für Gulftown auf 3,57 GHz (995X) bzw. 3,33 GHz (980) präsentieren. Aber die Preise machen diese zu Nischenangeboten für Sockel-1366—Aufrüster und Leute, die zwingend sechs Kerne, zwingend mehr als 24 PCI-E Lanes oder zwingend die allerschnellste CPU am Markt brauchen, koste es, was es wolle.

    Da die PCGH-CPU-Historie hiermit vollständig in der Gegenwart angekommen ist, erscheint vorerst keine neue Ausgabe mehr - jetzt müssen AMD und Intel zuerst neues Material für Rückblicke liefern.

    Bisher erschienen in der CPU-History-Serie:
    Die PCGH-CPU-Historie: Heute mit Sockel AM2, AM3 und F
    Die PCGH-CPU-Historie: Heute mit Sockel 775
    Die PCGH-CPU-Historie: Heute mit Sockel 754, 939 und 940
    Die PCGH-CPU-Historie: Heute mit Sockel 423 und 478
    Die PCGH-CPU-Historie: Heute mit dem Sockel A und Slot A von AMD

    Wissenswert: Mehr Informationen zum Thema finden Sie in:
    AMD Zen ab 2017: Alles zu Release-Termin, CPU-Sockel, technische Daten [Update]
  • Stellenmarkt

  • Print / Abo
    Apps
    PC Games Hardware 01/2017 PC Games 12/2016 PC Games MMore 01/2016 play³ 01/2017 Games Aktuell 12/2016 buffed 12/2016 XBG Games 11/2016
    PCGH Magazin 01/2017 PC Games 12/2016 PC Games MMORE Computec Kiosk On the Run! Birdies Run
article
820535
CPU
Rückblick
Im Verlauf dieser Serie möchten wir die wichtigsten CPU-Meilensteine seit Ende des letzten Jahrtausends vorstellen. Diese Woche: Integration bei Intel mit den Sockeln 1156 und 1366.
http://www.pcgameshardware.de/CPU-Hardware-154106/Specials/Rueckblick-820535/
17.04.2011
http://www.pcgameshardware.de/screenshots/medium/2011/04/f875k.jpg
intel,cpu
specials