Skylake X: Das heitere AVX-Takteraten hat ein Ende
Intels Skylake-X-CPUs gelten bei hohem Takt als besonders stromdurstig. Nicht zuletzt die dürftige Informationspolitik des Chipherstellers selbst hat dazu beigetragen, diesen Ruf zu festigen. Inzwischen hat PC Games Hardware die Bestätigung erhalten, dass die Taktraten mit AVX2- und AVX512f-Nutzung deutlich niedriger sind als von vielen vermutet. Zudem haben viele Boards unter OC-Bedingungen gearbeitet.
Auf dieser Seite
Mit der Sockel-2066-Plattform und den zugehörigen Skylake-X-Prozessoren hat Intel den Spagat zwischen hoher Single-Thread-Leistung und einer im HEDT deutlich höheren Kernzahl als bisher versucht. Ersteres wird durch flexible Turbo-Stufen, also Taktanhebungen innerhalb des Temperatur- oder Stromverbrauch-Limits, erreicht. Letzteres erforderte eine Umgestaltung der internen Verbindungen, sodass nun eine gitterartige Anordnung mit Verbindungsstellen an jedem Kern, Speicher-Controller, PCIe-x16-Port und den UPI-Ports anstelle des/der vorherigen Ringbusse(s) vorhanden ist.
Quelle: PC Games Hardware
AVX-Turbo in der Übersicht
Doch gerade die flexible Taktung der Kerne ist es, die für Verwirrung sorgte: Zwar gab Intel den maximal möglichen Single-Core-Takt (4,5 GHz), den All-Core-Turbo (4,0 GHz) und auch die Base-Clock (3,3 GHz) an, ließ dabei aber die Taktabstufung aus, die genutzt wird, wenn AVX2- und AVX512f-Befehle in die Recheneinheiten geschoben werden. Diese liegen, wie Intel uns erst jetzt, nach etlichen Nachfragen bestätigte, deutlich unter denen, die im Standard-Betrieb gelten. So erreicht etwa der Core i9-7900X einen Basistakt von 3.300 MHz, bei AVX2-Nutzung fällt dieser um 400 auf 2.900 MHz. Kommt gar die volle AVX-Packung mit AVX512f zum Einsatz, sind es nur noch 2.500 MHz. Entsprechend geringer fallen auch die Turbo-Unterschiede aus. Beim inzwischen lieferbaren Zwölfkerner Core i9-7920X sind Unterschiede bis zu 900 MHz zu verzeichnen. Die bisher veröffentlichten Details der schon lieferbaren Skylake-X-Prozessoren haben wir in der folgenden Tabelle zusammengetragen, die Werte für die 14- bis 18-Kern-Prozessoren liegen uns ebenfalls vor, fallen einstweilen aber noch unter das Stillschweigeabkommen bis zum Launch derselben.
Skylake X: Übersicht Taktraten & Turbostufen
| Intel Core … | i9-7980XE | i9-7960X | i9-7940X | i9-7920X | i9-7900X | i7-7820X | i7-7800X |
|---|---|---|---|---|---|---|---|
| Chip (die) | Skylake-SP HCC | Skylake-SP HCC | Skylake-SP HCC | Skylake-SP HCC | Skylake-SP LCC | Skylake-SP LCC | Skylake-SP LCC |
| Aktive Kerne | 18 | 16 | 14 | 12 | 10 | 8 | 6 |
| Hyperthreading (SMT) | Ja | Ja | Ja | Ja | Ja | Ja | Ja |
| Last-Level-Cache (MiByte) | 24,75 | 22,00 | 19,25 | 16,50 | 13,75 | 11,00 | 8,25 |
| Thermal Design Power (TDP) | 165 | 165 | 165 | 140 | 140 | 140 | 140 |
| Basis-Takt | 2.600 MHz | 2.800 MHz | 3.100 MHz | 2.900 MHz | 3.300 MHz | 3.600 MHz | 3.500 MHz |
| Turbo-Takt (alle Kerne) | 3.400 MHz | 3.600 MHz | 3.800 MHz | 3.800 MHz | 4.000 MHz | 4.000 MHz | 4.000 MHz |
| Turbo-Takt (1 - 2 Kerne) | 4.200 MHz | 4.200 MHz | 4.300 MHz | 4.300 MHz | 4.300 MHz | 4.300 MHz | 4.000 MHz |
| Maximaltakt (Turbo Boost 3) | 4.400 MHz | 4.400 MHz | 4.400 MHz | 4.400 MHz | 4.500 MHz | 4.500 MHz | N. unterstützt |
| AVX2-Basis-Takt | 2.300 MHz | 2.500 MHz | 2.700 MHz | 2.600 MHz | 2.900 MHz | 2.900 MHz | 3.500 MHz |
| AVX2-Turbo-Takt (alle Kerne) | 3.200 MHz | 3.300 MHz | 3.500 MHz | 3.400 MHz | 3.600 MHz | 3.700 MHz | 3.800 MHz |
| AVX2-Turbo-Takt (1 - 2 Kerne) | 3.700 MHz | 3.700 MHz | 3.700 MHz | 3.700 MHz | 4.000 MHz | 3.800 MHz | 3.800 MHz |
| AVX512-Basis-Takt | 2.000 MHz | 2.100 MHz | 2.400 MHz | 2.200 MHz | 2.500 MHz | 2.700 MHz | 3.000 MHz |
| AVX512-Turbo-Takt (alle Kerne) | 2.800 MHz | 3.000 MHz | 3.100 MHz | 2.900 MHz | 3.300 MHz | 3.500 MHz | 3.700 MHz |
| AVX512-Turbo-Takt (1 - 2 Kerne) | 3.500 MHz | 3.500 MHz | 3.500 MHz | 3.700 MHz | 4.000 MHz | 3.600 MHz | 3.800 MHz |
| AVX512-FMA-Einheiten pro Kern | 2 | 2 | 2 | 2 | 2 | 2 | 2 |
| PCIe-3.0-Lanes | 44 | 44 | 44 | 44 | 44 | 28 | 28 |
| Speichertakt (1 DIMM/Channel) | DDR4-2667 | DDR4-2667 | DDR4-2667 | DDR4-2667 | DDR4-2667 | DDR4-2667 | DDR4-2400 |
| Speicherkanäle | 4 | 4 | 4 | 4 | 4 | 4 | 4 |
| Preis | 1.999 US-$ | 1.699 US-$ | 1.399 US-$ | Ca. 1.130 EUR | Ca. 915 EUR | Ca. 550 EUR | Ca. 355 EUR |
Update 09.10.2017: Nachdem das NDA für die restlichen Core-i9-Prozessoren gefallen ist, haben wir die Werte in der Tabelle ergänzt.
Skylake X: Warum niedrigere AVX-Turbos?
Bei den AVX-Einheiten handelt es sich um sogenannte SIMD-/Vektor-Rechenwerke, welche dieselben Instruktionen auf mehrere Daten anwenden - daher auch der Name Advanced Vector Extensions. Grob vereinfacht gesagt spart man damit Steuerungslogik und kann auf deren Kosten den Durchsatz erhöhen - die Floating-Point Operations per Second (FLOPS) steigen. Bei AVX128, welches seit den Sandy-Bridge-CPUs der auch von AMD seit Bulldozer mitgetragene Standard ist, lag der Durchsatz pro Recheneinheit bei 16 FLOPS in Single- und 8 FLOPS in Double-Precision-Genauigkeit (FP32 respektive FP64). AVX2(56) verdoppelte den Durchsatz durch 256-bittige Fused-Multiply-Add-Befehle auf 32 SP- oder 16 DP-FLOPS und AVX512 verdoppelt ihn abermals, sodass Skylake X nun bis zu 32 DP- oder 64 SP-FLOPS pro Kern und Taktschritt an Durchsatz erreicht. Für den 10-Kerner bedeutet dies bei 3,3 GHz (normaler Basis- und AVX512-Allcore-Turbo) einen Durchsatz von 1,056 TFLOPS FP64 oder 2,11 FP32-TFLOPs.
Skylake X im Vergleich: Rechendurchsatz in GFLOPS
Quelle: PC Games Hardware
FP64-Durchsatz bei Skylake-X, Broadwell-E, Ryzen und Threadripper
AMD-Prozessoren inklusive aktueller Ryzen-Modelle bearbeiten hingegen die besonders FLOPS-, aber auch stromverbrauchsträchtigen FMA-Instrukionen nur bis AVX128 in voller Geschwindigkeit. Ein Wechsel auf das ebenfalls unterstützte AVX256 bringt keinen Geschwindigkeitsvorteil bei den reinen Berechnungen - kostet im Gegenzug aber auch keinen zusätzlichen Strom, sodass die Taktraten nicht angepasst werden müssen. Eine Stärke der AMD-CPUs sind allerdings getrennte AVX128-Multiplikationen und Additionen, welche sie parallel ausführen können und in dieser Disziplin in Führung liegen.
Bei aktuellen Intel-Prozessoren, speziell mit Skylake-X-Kernen, würden die hohen Taktraten im Turbo-Modus die Thermal Design Power sprengen, wenn sie auch bei den anspruchsvollen AVX2-/512f-Befehlen anlägen. Dass dabei auch die Leistung steigt, wird bei "Volllasttests" mit Prime 95 gern übersehen, das Mehr an Leistungsaufnahme verpufft ja nicht einfach, sondern wird durchaus in zusätzliche Rechenleistung umgesetzt.
Trotz allem bleibt jedoch ein Teil der Kritik gültig. Denn auch in "normalen" Anwendungen, welche kein leistungssteigerndes AVX2 nutzen, liegt die Effizienz nicht auf Top-Niveau - insgesamt gesehen ist Broadwell-E besser, in Teilbereichen wie Video-Transcoding oder im Cinebench R15 liegen auch AMDs Threadripper und Ryzen 7 vor Intels neuem 10-Kerner. Hier schlägt der Versuch, durch möglichst hohe Turbo-Takte die Single-Thread-Leistung zu verbessern, negativ zu Buche. Hohe Takte erfordern nämlich meist auch höhere Spannungen und die fließen quadratisch in die Formel zur Berechnung der Leistungsaufnahme ein. Mehr ist also nicht in jedem Fall besser.
Fazit: Skylake X und die Turbo-Takte
Bereits in unserem Test des Core i9-7900X haben wir der Taktproblematik einen größeren Textabschnitt gewidmet - und lagen mit unseren Schlüssen größtenteils richtig. Die Einhaltung der 140-Watt-Grenze, so hat Intel es uns zwischenzeitlich bestätigt, ist das gewollte, richtige und daher repräsentative Verhalten für X299-Boards, unsere Testergebnisse des i9-7900X haben daher nach wie vor volle Gültigkeit. Testergebnisse, bei denen die Prozessoren munter 200 Watt und mehr schluckten, so bestätigte es uns ein Intel-Mitarbeiter bei einer Veranstaltung am 4. September, seien außerhalb der Spezifikation entstanden. Für unsere Begriffe würde die unter Overclocking fallen.
Weiterhin bestätigte Intel inzwischen auch das von uns anhand der Benchmarks (s.o.) bereits nachgewiesene Vorhandensein der beiden möglichen AVX512-Einheiten in allen Skylake-X-Modellen.
Wir würden uns eine offenere Informationspolitik seitens der Hersteller, in diesem Falle Intel, wünschen. Einen Teil der negativen Berichterstattung einiger Medien, welche unreflektiert den hohen Stromverbrauch angeprangert haben, hat Intel sich absolut selbst zuzuschreiben.
HVEC komprimiert auch in niedrigeren Auflösungen besser. Ermöglicht also z.B. mit einer Bandbreite die vorher für 720p reichte nun 1080p.
Das Problem ist ja immer nicht nur der Codec, sondern auch die Programme die es vernünftig unterstützen müssen. Da gab es bei H264 im Laufe der Zeit noch Leistungssteigerungen. Das dürfte bei H265 und kommende Codecs nicht anders sein.
4K wird x265 mit mehr Bandbreite brauchen, also z.B. zusammen mit DVB-C2 oder DVB-S2.
Solange die öffentlich rechtlichen weiterhin nur in 720p senden, spielt das doch keine Rolle, welcher Standard unterstützt wird.
Und was ist mit 4k? Braucht es dann wieder einen neuen Standard?