Zen 4c ohne SMT: AMDs Cloud-CPUs gibt es auch ohne simultanes Multithreading
Am gestrigen Tag hat AMD im Rahmen seiner Data Center & AI Technology Premiere 2023 unter anderem die Cloud-CPU Bergamo vorgestellt, welche dank der insbesondere auf Effizienz optimierten Architektur Zen 4c bis zu 128 Prozessorkerne bietet. In diesem Segment experimentiert AMD auch ohne Simultaneous Multithreading ("SMT").
Die AMD Data Center & AI Technology Premiere hielt neben einer wahrhaft riesigen Profi-GPU respektive einer GPGPU ("General Purpose Computation on GPU"), welche unter dem Namen Instinct MI300X mit 192 GiByte HBM3 zum Kampf der Titanen gegen die Nvidia A100 ("Ampere") und die H100 ("Hopper") antreten soll, auch mehrere spezialisierte Server-CPUs für Enterprisekunden bereit. Für das anspruchsvolle Cloud-Segment steht Epyc Bergamo bereit.
Für die Cloud gibt es Epyc auch ohne SMT
Der Cloud-Prozessor Bergamo geht unter den Bezeichnungen AMD Epyc 9754, Epyc 9754S und Epyc 9734 mit bis zu 128 Zen-4c-Prozessorkernen und bis zu 256 Threads an den Start und soll laut AMD nicht weniger als die mit großem Abstand schnellste und effizienteste Cloud-CPU der Welt sein. Der Hersteller überraschte während der Vorstellung mit einem dritten Modell, die neben den zuvor bereits erwarteten Modellen mit 128C/256T und 112C/224T ganz auf SMT verzichtet. Ohne Simultaneous Multithreading ("SMT") werden 128C/128T geboten.
| Architektur | Codename | CCDs | Kerne/ Threads |
Taktfrequenz | TDP | |
|---|---|---|---|---|---|---|
| AMD Epyc 9754 | Zen 4c | Bergamo | 8 | 128/256 | 2,25 - 3,10 GHz | 360 |
| AMD Epyc 9754S | Zen 4c | Bergamo | 8 | 128/128 | 2,25 - 3,10 GHz | 360 |
| AMD Epyc 9734 | Zen 4c | Bergamo | 8 | 112/224 | 2,20 - 3,00 GHz | 340 |
Die optimierte Architektur ist auf Leistung per Watt ausgelegt, während die regulären Zen-4-CPUs mit und ohne 3D V-Cache für Leistung per Kern optimiert wurden. Die Prozessorkerne von Bergamo fallen um ca. 35 Prozent kleiner aus als die der regulären HPC-CPUs Genoa und Genoa-X mit mehr als 1 GiByte L3-Cache.
Genoa-X mit bis zu 96 Kernen und 1.152 MiByte L3-Cache
Die auf höchstmögliche Performance pro Kern optimierten Genoa-X bieten bis zu 1.152 MiByte L3-Cache und gehen unter den folgenden Bezeichnungen an den Start.
| Architektur | Codename | L3-Cache | Kerne/ Threads |
Taktfrequenz | TDP | |
|---|---|---|---|---|---|---|
| AMD Epyc 9684X | Zen 4 + 3D V-Cache | Genoa-X | 1.152 MiByte | 96/192 | 2,25 - 3,70 GHz | 400 |
| AMD Epyc 9384X | Zen 4 + 3D V-Cache | Genoa-X | 768 MiByte | 32/64 | 3,10 - 3,90 GHz | 320 |
| AMD Epyc 9184X | Zen 4 + 3D V-Cache | Genoa-X | 768 MiByte | 16/32 | 3,55 - 4,20 GHz | 320 |
AMD bietet noch mehr Vielfalt im Enterprise-Segment
Insbesondere die Server-CPUs der Serie Epyc wurden seit dem Erstscheinen der ersten Generation ("Naples"), über die zweite Generation ("Rome") sowie die dritte Generation ("Milan und Milan-X") deutlich ausgebaut. Die 4. Generation Epyc, welche jetzt als Epyc 9004 an den Start gehen, bieten bereits vier Baureihen: Genoa, Genoa-X, Bergamo und Siena. AMD bedient damit ebenso viele Bereiche: General Purpose, Technical, Cloud Native und Telco/Edge. AMD gewinnt im Enterprise-Bereich fortwährend neue Kunden und bedient Größen wie AWS und Microsoft.
Quelle: AMD
AMD Epyc 9004 bietet mit Genoa, Genoa-X, Bergamo und Siena insgesamt vier Modellreihen
AMD Instinct MI300X als weiteres Highlight
Neben den neuen Epyc-Prozessoren war die AMD Instinct MI300X, eine 153 Milliarden Transistoren starke GPGPU mit 192 GiByte HBM3 das Highlight des Events. Dieser Beschleuniger verkraftet bis zu 80.000 Parameter und übertrifft mit in Sachen Speicherbandbreite (5,2 TiByte/s) sogar eine Nvidia H100 teils deutlich.
Enterprise-Kunden können das Ganze gegen Ende des Jahres mit der "AMD Instinct Platform" auf die Spitze treiben und bis zu acht AMD Instinct MI300 mit insgesamt großzügig bemessenen 1,5 TiByte HBM3 kombinieren.
Quelle: AMD
AMD Instinct MI300X
Ihre Meinung ist gefragt!
Wie stehen Sie zu diesem Thema? Die PCGH-Redaktion freut sich über Ihre fundierte Meinung in den Kommentaren zu dieser Meldung. Um zu kommentieren, müssen Sie auf PCGH.de oder im Extreme-Forum eingeloggt sein. Sollten Sie noch keinen Account haben, könnten Sie sich hier unverbindlich registrieren.

Damit ein Threadripper Pro Zen 4 auf richtung 5 ghz kommen kann,muss diese aber echt verdammt stark bei den Transistoren steigen.Das geht halt auch nicht immer so weiter.Zumal der höhere Takt braucht mehr Strom und auch mehr Transistoren brauchen mehr Strom und er zeugen auch mehr Abwärme,das ist also ein teufelskreis neben der immer größeren benötigung von Chipsfläche.Nun verstehe ich warum der Takt ne längere Zeit stagniert hatte auch.
Deswegen auch der geringe Boosttakt
Vermutlich ist Intel bei den little-cores auch ähnlich vorgegangen (außerdem natürlich Featurekürzungen).
Deshalb wird für die nächsten Intel Chips die speziell für Mobile/Effizienz gedacht sind auch spannend, ob man diesen Weg gehen wird. Lunar Lake soll ja den Gerüchten nach besonders effiziente Ausrichtung genießen
Fallen dese weg wird der Core deutlich kleiner, braucht damit nochmal weniger Strom, ist aber nicht mehr so hoch taktbar.
Neben anderen Änderungen könnte dues der Grund für den kleineren Chipkern sein und erklärt, warum msn nur auf ca 3 Ghz boostet.
Deswegen auch der geringe Boosttakt
Es gibt wohl zwei Gründe, die dagegen Sprechen:
1: Wenn man nicht genug Threads hat, um die CPU auszulasten
2: Sicherheitslücken. Für den Nomalo eher irrelevant, für Cloudanbieter problematisch, da sie dann diese theoretische Sicherheitslücke einräumen müssen. Soweit ich weiß betrifft die SMT ganz generell.
Ohne/mit SMT, CPU-Z-Stresstest:
[Ins Forum, um diesen Inhalt zu sehen][Ins Forum, um diesen Inhalt zu sehen]
Jeder Kern benötigt knapp ein Watt mehr, die PP steigt trotzdem nur um ~10 Prozent an.