Skylake X: Das heitere AVX-Takteraten hat ein Ende

Intels Skylake-X-CPUs gelten bei hohem Takt als besonders stromdurstig. Nicht zuletzt die dürftige Informationspolitik des Chipherstellers selbst hat dazu beigetragen, diesen Ruf zu festigen. Inzwischen hat PC Games Hardware die Bestätigung erhalten, dass die Taktraten mit AVX2- und AVX512f-Nutzung deutlich niedriger sind als von vielen vermutet. Zudem haben viele Boards unter OC-Bedingungen gearbeitet.

News 08.09.2017 um 19:15 Uhr Carsten Spille Als bevorzugte Quelle auf Google hinzufügen

Quelle: PC Games Hardware

Aktuelle Änderungen hervorheben

Auf dieser Seite

1 Skylake X: Übersicht Taktraten & Turbostufen
2 Skylake X: Warum niedrigere AVX-Turbos?
3 Skylake X im Vergleich: Rechendurchsatz in GFLOPS
4 Fazit: Skylake X und die Turbo-Takte

Mit der Sockel-2066-Plattform und den zugehörigen Skylake-X-Prozessoren hat Intel den Spagat zwischen hoher Single-Thread-Leistung und einer im HEDT deutlich höheren Kernzahl als bisher versucht. Ersteres wird durch flexible Turbo-Stufen, also Taktanhebungen innerhalb des Temperatur- oder Stromverbrauch-Limits, erreicht. Letzteres erforderte eine Umgestaltung der internen Verbindungen, sodass nun eine gitterartige Anordnung mit Verbindungsstellen an jedem Kern, Speicher-Controller, PCIe-x16-Port und den UPI-Ports anstelle des/der vorherigen Ringbusse(s) vorhanden ist.

Quelle: PC Games Hardware AVX-Turbo in der Übersicht Doch gerade die flexible Taktung der Kerne ist es, die für Verwirrung sorgte: Zwar gab Intel den maximal möglichen Single-Core-Takt (4,5 GHz), den All-Core-Turbo (4,0 GHz) und auch die Base-Clock (3,3 GHz) an, ließ dabei aber die Taktabstufung aus, die genutzt wird, wenn AVX2- und AVX512f-Befehle in die Recheneinheiten geschoben werden. Diese liegen, wie Intel uns erst jetzt, nach etlichen Nachfragen bestätigte, deutlich unter denen, die im Standard-Betrieb gelten. So erreicht etwa der Core i9-7900X einen Basistakt von 3.300 MHz, bei AVX2-Nutzung fällt dieser um 400 auf 2.900 MHz. Kommt gar die volle AVX-Packung mit AVX512f zum Einsatz, sind es nur noch 2.500 MHz. Entsprechend geringer fallen auch die Turbo-Unterschiede aus. Beim inzwischen lieferbaren Zwölfkerner Core i9-7920X sind Unterschiede bis zu 900 MHz zu verzeichnen. Die bisher veröffentlichten Details der schon lieferbaren Skylake-X-Prozessoren haben wir in der folgenden Tabelle zusammengetragen, die Werte für die 14- bis 18-Kern-Prozessoren liegen uns ebenfalls vor, fallen einstweilen aber noch unter das Stillschweigeabkommen bis zum Launch derselben.

Skylake X: Übersicht Taktraten & Turbostufen

Intel Core …	i9-7980XE	i9-7960X	i9-7940X	i9-7920X	i9-7900X	i7-7820X	i7-7800X
Chip (die)	Skylake-SP HCC	Skylake-SP HCC	Skylake-SP HCC	Skylake-SP HCC	Skylake-SP LCC	Skylake-SP LCC	Skylake-SP LCC
Aktive Kerne	18	16	14	12	10	8	6
Hyperthreading (SMT)	Ja	Ja	Ja	Ja	Ja	Ja	Ja
Last-Level-Cache (MiByte)	24,75	22,00	19,25	16,50	13,75	11,00	8,25
Thermal Design Power (TDP)	165	165	165	140	140	140	140
Basis-Takt	2.600 MHz	2.800 MHz	3.100 MHz	2.900 MHz	3.300 MHz	3.600 MHz	3.500 MHz
Turbo-Takt (alle Kerne)	3.400 MHz	3.600 MHz	3.800 MHz	3.800 MHz	4.000 MHz	4.000 MHz	4.000 MHz
Turbo-Takt (1 - 2 Kerne)	4.200 MHz	4.200 MHz	4.300 MHz	4.300 MHz	4.300 MHz	4.300 MHz	4.000 MHz
Maximaltakt (Turbo Boost 3)	4.400 MHz	4.400 MHz	4.400 MHz	4.400 MHz	4.500 MHz	4.500 MHz	N. unterstützt
AVX2-Basis-Takt	2.300 MHz	2.500 MHz	2.700 MHz	2.600 MHz	2.900 MHz	2.900 MHz	3.500 MHz
AVX2-Turbo-Takt (alle Kerne)	3.200 MHz	3.300 MHz	3.500 MHz	3.400 MHz	3.600 MHz	3.700 MHz	3.800 MHz
AVX2-Turbo-Takt (1 - 2 Kerne)	3.700 MHz	3.700 MHz	3.700 MHz	3.700 MHz	4.000 MHz	3.800 MHz	3.800 MHz
AVX512-Basis-Takt	2.000 MHz	2.100 MHz	2.400 MHz	2.200 MHz	2.500 MHz	2.700 MHz	3.000 MHz
AVX512-Turbo-Takt (alle Kerne)	2.800 MHz	3.000 MHz	3.100 MHz	2.900 MHz	3.300 MHz	3.500 MHz	3.700 MHz
AVX512-Turbo-Takt (1 - 2 Kerne)	3.500 MHz	3.500 MHz	3.500 MHz	3.700 MHz	4.000 MHz	3.600 MHz	3.800 MHz
AVX512-FMA-Einheiten pro Kern	2	2	2	2	2	2	2
PCIe-3.0-Lanes	44	44	44	44	44	28	28
Speichertakt (1 DIMM/Channel)	DDR4-2667	DDR4-2667	DDR4-2667	DDR4-2667	DDR4-2667	DDR4-2667	DDR4-2400
Speicherkanäle	4	4	4	4	4	4	4
Preis	1.999 US-$	1.699 US-$	1.399 US-$	Ca. 1.130 EUR	Ca. 915 EUR	Ca. 550 EUR	Ca. 355 EUR

Update 09.10.2017: Nachdem das NDA für die restlichen Core-i9-Prozessoren gefallen ist, haben wir die Werte in der Tabelle ergänzt.

Skylake X: Warum niedrigere AVX-Turbos?

Bei den AVX-Einheiten handelt es sich um sogenannte SIMD-/Vektor-Rechenwerke, welche dieselben Instruktionen auf mehrere Daten anwenden - daher auch der Name Advanced Vector Extensions. Grob vereinfacht gesagt spart man damit Steuerungslogik und kann auf deren Kosten den Durchsatz erhöhen - die Floating-Point Operations per Second (FLOPS) steigen. Bei AVX128, welches seit den Sandy-Bridge-CPUs der auch von AMD seit Bulldozer mitgetragene Standard ist, lag der Durchsatz pro Recheneinheit bei 16 FLOPS in Single- und 8 FLOPS in Double-Precision-Genauigkeit (FP32 respektive FP64). AVX2(56) verdoppelte den Durchsatz durch 256-bittige Fused-Multiply-Add-Befehle auf 32 SP- oder 16 DP-FLOPS und AVX512 verdoppelt ihn abermals, sodass Skylake X nun bis zu 32 DP- oder 64 SP-FLOPS pro Kern und Taktschritt an Durchsatz erreicht. Für den 10-Kerner bedeutet dies bei 3,3 GHz (normaler Basis- und AVX512-Allcore-Turbo) einen Durchsatz von 1,056 TFLOPS FP64 oder 2,11 FP32-TFLOPs.

Skylake X im Vergleich: Rechendurchsatz in GFLOPS

Quelle: PC Games Hardware FP64-Durchsatz bei Skylake-X, Broadwell-E, Ryzen und Threadripper AMD-Prozessoren inklusive aktueller Ryzen-Modelle bearbeiten hingegen die besonders FLOPS-, aber auch stromverbrauchsträchtigen FMA-Instrukionen nur bis AVX128 in voller Geschwindigkeit. Ein Wechsel auf das ebenfalls unterstützte AVX256 bringt keinen Geschwindigkeitsvorteil bei den reinen Berechnungen - kostet im Gegenzug aber auch keinen zusätzlichen Strom, sodass die Taktraten nicht angepasst werden müssen. Eine Stärke der AMD-CPUs sind allerdings getrennte AVX128-Multiplikationen und Additionen, welche sie parallel ausführen können und in dieser Disziplin in Führung liegen.

Bei aktuellen Intel-Prozessoren, speziell mit Skylake-X-Kernen, würden die hohen Taktraten im Turbo-Modus die Thermal Design Power sprengen, wenn sie auch bei den anspruchsvollen AVX2-/512f-Befehlen anlägen. Dass dabei auch die Leistung steigt, wird bei "Volllasttests" mit Prime 95 gern übersehen, das Mehr an Leistungsaufnahme verpufft ja nicht einfach, sondern wird durchaus in zusätzliche Rechenleistung umgesetzt.

Trotz allem bleibt jedoch ein Teil der Kritik gültig. Denn auch in "normalen" Anwendungen, welche kein leistungssteigerndes AVX2 nutzen, liegt die Effizienz nicht auf Top-Niveau - insgesamt gesehen ist Broadwell-E besser, in Teilbereichen wie Video-Transcoding oder im Cinebench R15 liegen auch AMDs Threadripper und Ryzen 7 vor Intels neuem 10-Kerner. Hier schlägt der Versuch, durch möglichst hohe Turbo-Takte die Single-Thread-Leistung zu verbessern, negativ zu Buche. Hohe Takte erfordern nämlich meist auch höhere Spannungen und die fließen quadratisch in die Formel zur Berechnung der Leistungsaufnahme ein. Mehr ist also nicht in jedem Fall besser.

Fazit: Skylake X und die Turbo-Takte

Bereits in unserem Test des Core i9-7900X haben wir der Taktproblematik einen größeren Textabschnitt gewidmet - und lagen mit unseren Schlüssen größtenteils richtig. Die Einhaltung der 140-Watt-Grenze, so hat Intel es uns zwischenzeitlich bestätigt, ist das gewollte, richtige und daher repräsentative Verhalten für X299-Boards, unsere Testergebnisse des i9-7900X haben daher nach wie vor volle Gültigkeit. Testergebnisse, bei denen die Prozessoren munter 200 Watt und mehr schluckten, so bestätigte es uns ein Intel-Mitarbeiter bei einer Veranstaltung am 4. September, seien außerhalb der Spezifikation entstanden. Für unsere Begriffe würde die unter Overclocking fallen.

Weiterhin bestätigte Intel inzwischen auch das von uns anhand der Benchmarks (s.o.) bereits nachgewiesene Vorhandensein der beiden möglichen AVX512-Einheiten in allen Skylake-X-Modellen.

Wir würden uns eine offenere Informationspolitik seitens der Hersteller, in diesem Falle Intel, wünschen. Einen Teil der negativen Berichterstattung einiger Medien, welche unreflektiert den hohen Stromverbrauch angeprangert haben, hat Intel sich absolut selbst zuzuschreiben.