AMD Ryzen Threadripper 2990X: Auswirkungen des Quad-Channel-Speicher-Interfaces getestet
AMDs kommendes Sockel-TR4-Topmodell, angeblich Ryzen Threadripper 2990X getauft, nutzt zwar wie die großen Epyc-Prozessoren 32 Kerne, muss aber mit der Hälfte an Speicher-Kanälen auskommen. Roman "der8auer" Hartung hat sich anhand eines Epyc 7601 angesehen, wie sich das auf die Performance auswirkt - und die Ergebnisse sind besser als erwartet.
Der8auer gehört zu den wenigen Menschen, die es schaffen, AMDs Server-Prozessoren aus der Epyc-Reihe zu übertakten. Deren Multiplikatoren sind eigentlich geschlossen, die BIOS-Versionen der Mainboards bieten kaum Einstellungsoptionen. Anhand eines übertakteten Epyc 7601 hat sich der Bastler bereits Mitte Juli angesehen, wie die Leistung von AMDs kommendem Sockel-TR4-32-Kerner ausfallen könnte. Dieser soll Ryzen Threadripper 2990X heißen und nutzt wie die Server-CPUs vier Siliziumchips auf einem Package, muss aufgrund der Kompatibilität zu X399-Mainboards jedoch mit der Hälfte der Speicherkanäle auskommen. Jeder Die hat derer zwei, was eigentlich ein Octa-Channel-Interface ergäbe. Die Platinen sind bisher auf den Betrieb von zwei Dies (Quad-Channel) ausgelegt, können also nicht acht Signalwege routen. Die schnelle Lösung: Vier DDR4-Controller werden deaktiviert.
Ryzen Threadripper 2990X mit verschiedenen RAM-Konfigurationen simuliert
In seinem ursprünglichen Test hat der8auer lediglich eine Speicherkonfiguration ausprobiert, bei der jede zweite RAM-Bank mit einem DDR4-Riegel versehen wurde. Das entspricht einer Nutzung von je einem Speicherkanal pro Die. Bei 3,8 GHz auf allen 32 Kernen brach die Performance im Cinebench R15 von knapp 5.900 auf 3.900 Punkte ein. Das ist jedoch die unwahrscheinlichere Lösung, da AMD für eine solche RAM-Aufteilung ein neues Package designen müsste. Nutzt der Chiphersteller das bisherige weiter (auf dem schon vier Dies saßen, von denen zwei komplett deaktiviert wurden), würden die zwei Speicher-Controller des Dies oben links und unten rechts genutzt. Die zwei anderen Dies müssten die Daten über den Infinity-Fabric von ihren benachbarten Siliziumchips beziehen.
Bildergalerie
Zumindest im Cinebench-R15-Benchmarks bricht die Leistung mit einer solchen Konfiguration deutlich geringer ein. Bei 3,8 GHz sinkt das Ergebnis um nicht einmal zwei Prozent auf knapp 5.800 Punkte. Die Latenz- und Bandbreitenergebnisse in AIDA64 sind auf dem ersten Blick ebenfalls gut, wobei der Test nicht auf die Threadripper-Konfiguration angepasst sei und daher immer den ersten Die teste. Der8auer erwartet letztendlich eine kleinere Auswirkung durch das Quad-Channel-Interface als zunächst angenommen - wie genau die Beeinträchtigung aussieht, hängt letzten Endes auch von der Anwendung ab.
Mehr über AMDs neue CPU-Topmodelle: Ryzen Threadripper 2000 angekündigt: Bis zu 32 Kerne und 12 nm
Mit einer 2+0+2+0-Speicherkonfiguration würde AMD indes auch eine konsistente Performance zu kleineren Ryzen-Threadripper- und Ryzen-Prozessoren erreichen, zum Beispiel wenn man doch mal auf der Workstation spielen möchte. Viel mehr als acht Kerne werden selten ausgenutzt, sodass ein Spiel auf einen einzelnen Die mit zwei RAM-Controllern statt einem einzelnen zugreifen könnte.

Die wirklich nennenswerten Zugewinne werden nur mehr durch Parallelisierung erzielt werden.
Oder es schlägt irgendwann die Stunde der JIT-Compiler. Aber die kennen a priori auch nicht alle Code Branches. Wer weiß, was noch kommt...
Edit: Was ich ja glaube: als nächste (große) Revolution kommen die Graphen Transistoren mit einer hybriden Architektur, Von-Neumann-Architektur + hardwarebasiertes neuronales Netz
Instruction Level Paralellism ist schon oder weniger ausgereizt, Zugewinne sind am ehesten wohl noch durch spekulative Ausführung drinnen, da dürfte Intel relativ viel rausholen im Vergleich, was allerdings auch nicht frei von Nebenwirkungen ist, wie sich gezeigt hat. Ich schätze mal im Vergleich zu den schnellsten Cores heute (Skylake-Typ @5,3 GHz) sind vielleicht 10 bis maximal 20% noch drin.
Die wirklich nennenswerten Zugewinne werden nur mehr durch Parallelisierung erzielt werden. Die Softwareentwickler werden sich daran anpassen müssen, wenn sie zusätzliche Ressourcen verwenden wollen. Insofern ist AMD hier genau auf dem richtigen Weg!
Dieses Core Wettrennen musste ja kommen aber was tun mit den Cores ?
Für Videoediting (woraus ich stamme) eine tolle sache aber alltag und Gaming, wie gesagt lieber 8 Cores mit satter IPC.