Ryzen 9 5950X: Leistungsbremse SMT? Benchmark-Vergleich 32 Threads vs. 16 Kerne mit Überraschungen [Update]
Update mit Geforce: AMD hat es im Laufe von drei Jahren vom Totgesagten zum Prozessor-Leistungskönig geschafft. Das neue Topmodell Ryzen 9 5950X bricht sowohl in Spielen als auch beim Rendering alle Rekorde - doch geht da noch mehr? In einer speziellen Messreihe klopfen wir nicht nur die Leistung im CPU-Limit ab, sondern sehen uns auch an, inwiefern das standardmäßig aktive Simultaneuos Multi-Threading (SMT) die Spiele-Leistung beeinflusst.
Auf dieser Seite
Update vom 12. Januar: Wie versprochen, haben wir nun auch eine Geforce RTX 3090 durch die 25 Spiele-Benchmarks gescheucht. Somit können wir ein gültiges Fazit zum SMT-Verhalten des AMD Ryzen 9 5950X sowohl für Radeon- als auch Geforce-Nutzer ziehen. Alle Textabschnitte dieses Artikels befinden sich auf dem neuesten Stand.
Die Zen-Architektur, besser bekannt unter ihrem Marketing-Namen Ryzen, brachte AMD zurück in Spiel. 2017 gestartet, arbeitete sich der Prozessorhersteller mit Zen+, Zen 2 und Zen 3 zielstrebig voran und dominiert nun die Benchmarks. PCGH zollte dieser Entwicklung bereits Mitte 2020 Tribut und wechselte als erste Redaktion auf ein AMD-Ryzen-basiertes Testsystem für Grafikkarten. Nun erfolgt die Revision dieses mächtigen, aber nicht unfehlbaren Testsystems: Der Ryzen 9 3900X (12C/24T) muss einem Ryzen 9 5950X (16T/32T) weichen und ein paar der 20 Testspiele werden durch neuere Exemplare ausgetauscht, um ein noch schärferes Leistungsbild zu zeichnen. Derzeit laufen die Vortests, und zwar über mehrere Wochen - kein PCGH-Parcours wird leichtfertig beschlossen, kein Testsystem unoptimiert festgelegt.
Quelle: PC Games Hardware
Cinebench R20: Das neue Grafikkarten-Testsystem 2021 in Aktion
In diesem Artikel präsentieren wir Ihnen die erste Messreihe auf Basis des neuen Systems. Wir sagen's frei heraus: Im Grunde handelt es sich bei diesen Daten um ein "Abfallprodukt" im Rahmen der Evalution - allerdings um ein wertvolles! Im Zentrum steht die Frage, inwiefern das bei modernen Prozessoren standardmäßig aktive Simultaneuos Multi-Threading (SMT) die Spiele-Leistung beeinflusst. Um diese zu beantworten, ließen wir den zuvor ausoptimierten Zen-3-Prozessor die 25 potenziellen Benchmark-Spiele durchlaufen - einmal mit SMT (16 Kerne, 32 Threads) und einmal ohne SMT (16 Kerne, 16 Threads).
Quelle: AMD
Zen 3 aka Ryzen 5000: CPU-Layout
Synchrones, manchmal fadenscheiniges Fadenspinnen
SMT, Intels Version heißt "Hyper-Threading", erlaubt es einem Prozessor, pro Kern zwei anstelle nur einer großen Aufgabe, Thread genannt, gleichzeitig abzuarbeiten. Aus einem Vierkerner wird somit ein 8-Threader mit acht logischen Kernen, welcher besser mit der parallelisierten Aufgabenflut moderner Applikationen zurechtkommt. Im Gegensatz zu "echten" (physischen) Kernen findet bei Synchronous Multi-Threading eine Ressourcenteilung statt, sodass vollwertige Kerne gegenüber logischen vorzuziehen sind. Kann ein Spiel beispielsweise acht Threads bedienen, ist ein vollwertiger Achtkerner schneller als ein Vierkerner, welcher via SMT acht Threads bearbeiten kann. Letzterer schlägt einen Vierkerner/-threader in diesem Fall zuverlässig. Einen Prozessor mit diesem Feature auszustatten, kostet nur wenig Fläche auf dem Chip, sorgt im besten Fall aber für eine fast verdoppelte Leistung pro Kern.
Doch die clevere "Aus 1 mach 2"-Idee hat auch Nebenwirkungen. In der Vergangenheit zeigte sich bei fast allen Prozessorarchitekturen eine Performance-Regression in Spielen, wenn sehr viele Kerne und Threads bereitgestellt wurden. Dies lag unter anderem daran, dass der Windows-eigene Aufgabenverteiler, Scheduler genannt, anstelle eines physischen einen logischen Kern einspannte, sodass Rechenkraft verschenkt wurde. Ferner ist damals wie heute zu beobachten, dass PC-Spiele sich auf eine andere Art und Weise "verhaspeln", wenn sie mit zu vielen Kernen/Threads konfrontiert werden. Was bei den ersten Threadripper-CPUs in gar nicht startenden Spiele-Einzelfällen gipfelte, äußert sich meist durch einen verhältnismäßig harmlosen Leistungsverlust. Programme abseits des spielerischen Bereichs weisen dieses Problem nicht oder nur in Ausnahmen auf, sodass hier mehr Threads meist mit mehr Leistung gleichzusetzen sind.
Nun handelt es sich beim AMD-Topmodell Ryzen 9 5950X (PCGH-Test) um einen Prozessor, welcher der Software-Landschaft weitestgehend voraus aus. Kein PC-Spiel dieser Welt kann dessen 16 Kerne und 32 Threads abseits von Dekompressions- und Shader-Kompilierungsaktionen auslasten. Wie oft dabei "Fehlgriffe" stattfinden, lässt sich von außen nicht valide beurteilen. Statistisch ist die Sache jedoch klar: Weiß ein Spiel nicht genau, was es tut, stellen 50 Prozent der angebotenen Threads nicht die beste Wahl dar. Praktischerweise lässt sich SMT bei jedem dazu fähigen Prozessor in der Firmware (UEFI/BIOS) deaktivieren. Was übrig bleibt, sind die physischen Prozessorkerne - die erste Wahl, wenn es um Leistung geht. Es existieren aber auch Spiele, welche auf eine bestimmte Anzahl von Kernen/Threads optimiert wurden. So läuft beispielsweise Battlefield 5 auf einem Intel Core i9-10900K mit einer 10C/16T-Konfiguration schneller als mit den ganzen 20 logischen Kernen, wie der Test zu Comet Lake-S zeigt.
Zen 3 vs. Zen 2
Fehlgriffe zu "falschen" Kernen sind ohne SMT ausgeschlossen, sofern man einmal spezifische CPU-Layouts - wie die mehrfach vorhandenen CPU-Dies bei Ryzen-CPUs - außer Acht lässt. Bis inklusive Ryzen 3000 besteht die Basiseinheit eines jeden Zen-Prozessors, der Core Complex oder kurz CCX, aus vier Kernen und 16 MiByte L3-Zwischenspeicher. Modelle mit mehr als vier Kernen bestehen aus mehreren CCX-Chips, die über einen Verwalter, den Infinity Fabric (IF), miteinander kommunizieren.
Will ein Core aus dem CCX #0 mit einem Core aus dem CCX #1 kommunizieren, muss dafür ein zeitaufwendiger Umweg genommen werden, die Core-to-Core-Latenz steigt, was Leistung kostet. Bei Zen 3 weist ein CCX nun acht anstelle von vier Kernen auf. Dadurch ergibt sich nicht nur die doppelte Anzahl von Kernen (pro CCX) und Threads gegenüber Ryzen 3000, sondern auch, dass ein einzelner CPU-Kern bei Bedarf auf die vollen 32 MByte L3-Cache eines CCX zurückgreifen kann.
Quelle: AMD
Zen 3 vs. Zen 2: Letzterer nutzt CCX-Blöcke à 4 Kerne, sein Nachfolger verdoppelt den Inhalt auf 8 Kerne und macht den L3-Cache gemeinsam für alle Kerne oder jeden einzeln nutzbar.
25 Spiele im SMT-Test: Benchmark-Ergebnisse
Der Technikausflug war unumgänglich, um die nun folgenden Benchmark-Ergebnisse und Überlegungen dahinter einzuordnen. Das Unvermögen einiger Spiele, physische und logische Kerne gewinnbringend einzusetzen, ist trotz kontinuierlicher Lerneffekte keineswegs vom Tisch. Angesichts des Überangebots von Kernen und Threads neuer Prozessoren stellt sich unweigerlich die Frage, ob das zusammenpasst. Wir haben daher im Rahmen des eingangs erwähnten Testsystem-Upgrades eine spezielle Messreihe durchgeführt. Die Basis dafür bildet das fertig optimierte Grafikkarten-Testsystem 2021, welches zu weiten Teilen dem 2020er-Aufbau folgt. Neu ist besagter AMD Ryzen 9 5950X, ein wahres Multithread-Monster. Was wohl passiert, wenn wir Simultaneous Multi-Threading in der Firmware des Mainboards abschalten? Hätten wir es mit einem Zwei- oder Vierkerner zu tun, wäre die Sache klar: Die Leistung sänke sowohl in Spielen als auch Anwendungen.
Was der 8+8-Kerner dazu sagt, haben wir anhand von 25 populären Spielen der Baujahre 2015 bis 2020 geprüft. Das System verfügt neben messerscharf eingestelltem Arbeitsspeicher über eine PBO- und Spannungsoptimierung mittels Curve Optimizer und erreicht somit zwischen 10 und 20 Prozent bessere Leistungsdaten als ein gemäß Spezifikation betriebener Ryzen 9 5950X.
Bei alldem kommen zwei Referenz-Grafikkarten nebst aktueller Treiber zum Einsatz. Aufseiten AMDs handelt es sich um eine Radeon RX 6900 XT, welche zwecks optimaler Leistung auf Smart Access Memory (SAM) zurückgreifen kann. Aufseiten Nvidias verwenden wir eine Geforce RTX 3090 Founders Edition. Das finale GPU-Testsystem 2021 in der Übersicht:
| Prozessor | AMD Ryzen 9 5950X (Curve-optimized, ~4,9 GHz) |
|---|---|
| Mainboard | Asus X570 ROG Crosshair VIII Hero (PCI-E 4.0 & SAM) |
| Arbeitsspeicher | 32 GiB DDR4 (Corsair Dominator Platinum RGB, 2× 16 GiB, B-Dies) |
| RAM-Takt & -timings | DDR4-3800 (14-15-14-26-1T), Infinity Fabric @ 1,9 GHz |
| Datenträger (primär) | Gigabyte Aorus NVMe ×4 Gen4 SSD 2TB |
| Netzteil | Thermaltake Toughpower iRGB Plus 1250W |
| Kühlsystem | Alphacool Eisblock + Nexxos ST30 + Eisstation |
Interessant beim Ergebnisvergleich wird sein, inwiefern sich Radeon und Geforce auf demselben Unterbau verhalten. Hier lehrt die Vergangenheit, dass eine Ableitung der Daten nicht immer möglich ist - der Nvidia-Treiber schöpft in der Regel eine höhere Leistung aus den gegebenen CPU-Ressourcen, sofern ältere Schnittstellen inklusive DirectX 11 zum Einsatz kommen. AMD zeigt hingegen Stärke bei den Lower-Level-APIs DirectX 12 und Vulkan.
Kommen wir nun zu den Ergebnissen. Da es uns um die Leistung der Infrastruktur geht, testen wir konsequent mit maximalen Spieldetails, aber minimaler 16:9-Auflösung (Erklärung, warum das sinnvoll ist). Die künftigen Grafikkarten-Benchmarks, für die das System aufgebaut wurde, finden hingegen mit maximaler Grafiklast statt - doch das ist das Thema eines folgenden Artikels.
Die folgenden Benchmarks entsprechen stets einem Mittelwert aus drei bis vier Testwiederholungen.
Auswertung: Radeon
Die Ergebnisse mit der Radeon RX 6900 XT sprechen eine klare Sprache: SMT reduziert die Bildrate in den meisten Fällen. Schaut man rein auf die Durchschnitts-Fps, führt die Konfiguration mit aktivem SMT (32 Threads) in lediglich 5 von 25 Spielen. Bezieht man die Frametime-Verteilung in die Betrachtung mit ein, gibt es im Grunde nur zwei Fälle, bei denen die 32T-Konfiguration messbar zulegen kann, und zwar in Battlefield 5 und Death Stranding. Die Bildberechnungszeit (Frametime) der meisten Frames nimmt ab, das P1-Perzentil der Fps steigt.
20 Spiele laufen hingegen ohne SMT besser als mit SMT. In den meisten Fällen beträgt die Differenz der Durchschnitts-Fps weniger als fünf Prozent, hin und wieder entspricht die Stilllegung von SMT aber auch dem Lösen einer Handbremse. Während Doom Eternal um 14 Prozent beim P1-Perzentil zulegt, explodiert die Bildrate in Desperados 3 - plus 45 Prozent kommen durchschnittlich dazu, Messfehler ausgeschlossen. Hier haben wir es mit einem Klassiker der Gattung "Engine verschluckt sich an zu vielen Threads" zu tun, welcher jedoch die Ausnahme darstellt.
Auswertung: Geforce
Die Geforce RTX 3090 auf demselben Systen offenbart, dass die Grafikkarte deutliche Auswirkungen darauf hat, wie PC-Spiele im CPU-Limit laufen. Besonders interessant ist, wie unterschiedlich einige Titel auf den Wechsel des Grafikchips reagieren, während andere Spiele auf Radeon und Geforce nahezu identisch laufen. Letzteres ist die Ausnahme, das zeigen die spannenden Ergebnisse zweifellos - am besten, Sie klicken sich einmal durch und vergleichen Geforce und Radeon.
Zu den markantesten Ergebnissen zählen Assassin's Creed Valhalla und Desperados 3. Ersteres hat nach wie vor ein nicht übersehbares Faible für Radeon-Grafikkarten, die RX 6900 XT läuft der RTX 3090 meilenweit davon. Die Geforce-Werte in Desperados 3 unterstreichen die der Radeon, auch mit Nvidia-Chips wirkt SMT wie eine Handbremse. Die RTX 3090 legt relativ und absolut sogar noch stärker zu als die RX 6900 XT, sobald SMT deaktiviert wird.
So unterschiedlich die Ergebnisse von Radeon und Geforce im Detail ausfallen, so haben sie doch eines gemeinsam: SMT kostet öfter Leistung, als es Leistung bringt. Im Folgenden haben wir einige der Messungen in Gestalt von Frametime-Verläufen abgebildet. Im Gegensatz zu den Fps gilt hier: weniger ist besser! Wir beschränken uns auf die markantesten Fälle.
Wir gehen davon aus, dass sich ein Ryzen 9 5900X ähnlich verhält wie der 5950X (beide arbeiten mit zwei CCX), mit vergleichbaren Differenzen zwischen SMT an und SMT aus. Offen ist hingegen, inwiefern diese Beobachtungen für ältere Ryzen-Prozessoren oder beispielsweise einen 5800X gelten - und Intel ist ein Thema für sich, denn SMT ist nicht SMT. Wir werden in den kommenden Wochen weitere Benchmarks anfertigen, die sich dieser Frage annehmen.
Randbetrachtung: High-Fps-Gaming
Völlig losgelöst vom Artikelkontext zeigen die Benchmarks des ausgereizten Ryzen 9 5950X noch etwas: PC-Gaming mit extrem hohen Bildraten ist zweifellos möglich. Die meisten Spiele Zusammenfassend lässt sich sagen, dass die Abschaltung von SMT mehr Gewinn als Verlust bringt.
laufen trotz maximaler Details mit weit dreistelligen Bildraten, von Hardware-Fressern wie Crysis Remastered, Red Dead Redemption 2 und Watch Dogs Legion abgesehen. Das Problem dabei ist, dass zwar die Infrastruktur rund um den Ryzen-5000-Prozessor in der Lage zu hohen Fps ist, diese Leistung jedoch im Grafiklimit verbreiteter Auflösungen untergeht. Um in der beliebten WQHD-Auflösung mit diesen Bildraten zu spielen, müssten Grafikkarten um den Faktor 2 bis 3 zulegen.
Zusammenfassend lässt sich sagen, dass die Abschaltung von SMT mehr Gewinn als Verlust bringt - die Leistung nimmt nirgends signifikant ab, legt aber dafür im Mittel leicht und in Einzelfällen stark zu. Das gilt selbstverständlich nur für Spiele. Wer seinen Ryzen 9 5950X vorwiegend produktiv nutzt, sollte SMT tunlichst anlassen, um keine Leistung bei Rendering & Co. zu verschenken. Angesichts der Ergebnisse werden wir das Grafikkarten-Testsystem für alle anstehenden Spiele voraussichtlich ohne SMT betreiben. Hier ist das letzte Wort aber noch nicht gesprochen.
Nach 10 Jahren sollte das jedem Konsumenten klar sein?
Anfang? Seit mind. 2010 (SandyBridge) haben Spiele (und schlecht programmierte Anwendunge) Probleme damit. Das sind 10 Jahre in denen die Entwickler der Spiele hätten reagieren können.
Nach 10 Jahren sollte das jedem Konsumenten klar sein?
MfG
Raff