Zen 4c ohne SMT: AMDs Cloud-CPUs gibt es auch ohne simultanes Multithreading

8
News Sven Bauduin Als bevorzugte Quelle auf Google hinzufügen
AMD Epyc
Quelle: AMD

Am gestrigen Tag hat AMD im Rahmen seiner Data Center & AI Technology Premiere 2023 unter anderem die Cloud-CPU Bergamo vorgestellt, welche dank der insbesondere auf Effizienz optimierten Architektur Zen 4c bis zu 128 Prozessorkerne bietet. In diesem Segment experimentiert AMD auch ohne Simultaneous Multithreading ("SMT").

Die AMD Data Center & AI Technology Premiere hielt neben einer wahrhaft riesigen Profi-GPU respektive einer GPGPU ("General Purpose Computation on GPU"), welche unter dem Namen Instinct MI300X mit 192 GiByte HBM3 zum Kampf der Titanen gegen die Nvidia A100 ("Ampere") und die H100 ("Hopper") antreten soll, auch mehrere spezialisierte Server-CPUs für Enterprisekunden bereit. Für das anspruchsvolle Cloud-Segment steht Epyc Bergamo bereit.

Für die Cloud gibt es Epyc auch ohne SMT

Der Cloud-Prozessor Bergamo geht unter den Bezeichnungen AMD Epyc 9754, Epyc 9754S und Epyc 9734 mit bis zu 128 Zen-4c-Prozessorkernen und bis zu 256 Threads an den Start und soll laut AMD nicht weniger als die mit großem Abstand schnellste und effizienteste Cloud-CPU der Welt sein. Der Hersteller überraschte während der Vorstellung mit einem dritten Modell, die neben den zuvor bereits erwarteten Modellen mit 128C/256T und 112C/224T ganz auf SMT verzichtet. Ohne Simultaneous Multithreading ("SMT") werden 128C/128T geboten.

AMD Epyc Bergamo Quelle: AMD Zen 4c Quelle: AMD
  Architektur Codename CCDs Kerne/
Threads
Taktfrequenz TDP
AMD Epyc 9754 Zen 4c Bergamo 8 128/256 2,25 - 3,10 GHz 360
AMD Epyc 9754S Zen 4c Bergamo 8 128/128 2,25 - 3,10 GHz 360
AMD Epyc 9734 Zen 4c Bergamo 8 112/224 2,20 - 3,00 GHz 340

Die optimierte Architektur ist auf Leistung per Watt ausgelegt, während die regulären Zen-4-CPUs mit und ohne 3D V-Cache für Leistung per Kern optimiert wurden. Die Prozessorkerne von Bergamo fallen um ca. 35 Prozent kleiner aus als die der regulären HPC-CPUs Genoa und Genoa-X mit mehr als 1 GiByte L3-Cache.

Genoa-X mit bis zu 96 Kernen und 1.152 MiByte L3-Cache

Die auf höchstmögliche Performance pro Kern optimierten Genoa-X bieten bis zu 1.152 MiByte L3-Cache und gehen unter den folgenden Bezeichnungen an den Start.

  Architektur Codename L3-Cache Kerne/
Threads
Taktfrequenz TDP
AMD Epyc 9684X Zen 4 + 3D V-Cache Genoa-X 1.152 MiByte 96/192 2,25 - 3,70 GHz 400
AMD Epyc 9384X Zen 4 + 3D V-Cache Genoa-X 768 MiByte 32/64 3,10 - 3,90 GHz 320
AMD Epyc 9184X Zen 4 + 3D V-Cache Genoa-X 768 MiByte 16/32 3,55 - 4,20 GHz 320

AMD bietet noch mehr Vielfalt im Enterprise-Segment

Insbesondere die Server-CPUs der Serie Epyc wurden seit dem Erstscheinen der ersten Generation ("Naples"), über die zweite Generation ("Rome") sowie die dritte Generation ("Milan und Milan-X") deutlich ausgebaut. Die 4. Generation Epyc, welche jetzt als Epyc 9004 an den Start gehen, bieten bereits vier Baureihen: Genoa, Genoa-X, Bergamo und Siena. AMD bedient damit ebenso viele Bereiche: General Purpose, Technical, Cloud Native und Telco/Edge. AMD gewinnt im Enterprise-Bereich fortwährend neue Kunden und bedient Größen wie AWS und Microsoft.

AMD Epyc 9004 bietet mit Genoa, Genoa-X, Bergamo und Siena insgesamt vier Modellreihen Quelle: AMD AMD Epyc 9004 bietet mit Genoa, Genoa-X, Bergamo und Siena insgesamt vier Modellreihen

AMD Instinct MI300X als weiteres Highlight

Neben den neuen Epyc-Prozessoren war die AMD Instinct MI300X, eine 153 Milliarden Transistoren starke GPGPU mit 192 GiByte HBM3 das Highlight des Events. Dieser Beschleuniger verkraftet bis zu 80.000 Parameter und übertrifft mit in Sachen Speicherbandbreite (5,2 TiByte/s) sogar eine Nvidia H100 teils deutlich.

AMD Instinct MI300X Quelle: AMD AMD Instinct MI300X Quelle: AMD

Enterprise-Kunden können das Ganze gegen Ende des Jahres mit der "AMD Instinct Platform" auf die Spitze treiben und bis zu acht AMD Instinct MI300 mit insgesamt großzügig bemessenen 1,5 TiByte HBM3 kombinieren.

AMD Instinct MI300X Quelle: AMD AMD Instinct MI300X

Ihre Meinung ist gefragt!

Wie stehen Sie zu diesem Thema? Die PCGH-Redaktion freut sich über Ihre fundierte Meinung in den Kommentaren zu dieser Meldung. Um zu kommentieren, müssen Sie auf PCGH.de oder im Extreme-Forum eingeloggt sein. Sollten Sie noch keinen Account haben, könnten Sie sich hier unverbindlich registrieren.

Empfohlener redaktioneller Inhalt [EMBED_URL] An dieser Stelle finden Sie externe Inhalte von [PLATTFORM]. Zum Schutz Ihrer persönlichen Daten werden externe Einbindungen erst angezeigt, wenn Sie dies durch Klick auf "Alle externen Inhalte laden" bestätigen: Ich bin damit einverstanden, dass mir externe Inhalte angezeigt werden. Damit werden personenbezogene Daten an Drittplattformen übermittelt. Mehr dazu in unserer Datenschutzerklärung.
Externe Inhalte Mehr dazu in unserer Datenschutzerklärung.
8
    • Kommentare (8)

      Zur Diskussion im Forum
      • Von latiose88 BIOS-Overclocker(in)
        ah ok sehr interessant.Gibt es ne Info für wieviel 100 mhz man jeweils mehr Transistoren braucht um höheren Takt zu haben oder kann man das nirgendswo nachlesen oder gab es da mal Tests wo das genau gemessen wird.

        Damit ein Threadripper Pro Zen 4 auf richtung 5 ghz kommen kann,muss diese aber echt verdammt stark bei den Transistoren steigen.Das geht halt auch nicht immer so weiter.Zumal der höhere Takt braucht mehr Strom und auch mehr Transistoren brauchen mehr Strom und er zeugen auch mehr Abwärme,das ist also ein teufelskreis neben der immer größeren benötigung von Chipsfläche.Nun verstehe ich warum der Takt ne längere Zeit stagniert hatte auch.
      • Von latiose88 BIOS-Overclocker(in)
        ah ok sehr interessant.Gibt es ne Info für wieviel 100 mhz man jeweils mehr Transistoren braucht um höheren Takt zu haben oder kann man das nirgendswo nachlesen oder gab es da mal Tests wo das genau gemessen wird.

        Damit ein Threadripper Pro Zen 4 auf richtung 5 ghz kommen kann,muss diese aber echt verdammt stark bei den Transistoren steigen.Das geht halt auch nicht immer so weiter.Zumal der höhere Takt braucht mehr Strom und auch mehr Transistoren brauchen mehr Strom und er zeugen auch mehr Abwärme,das ist also ein teufelskreis neben der immer größeren benötigung von Chipsfläche.Nun verstehe ich warum der Takt ne längere Zeit stagniert hatte auch.
      • Von Rollora Kokü-Junkie (m/w)
        Zitat von Bärenmarke
        Genau das hat AMD bei der Präsentation erklärt, da der Core mehr auf Effizienz getrimmt ist konnten sie ihn verkleinern und die Transistoren die man für höheren Takt benötigt einsparen.
        Deswegen auch der geringe Boosttakt
        Perfekt danke, dann lag ich mit meiner Annahme richtig und sogar mit AMD Sanctus

        Vermutlich ist Intel bei den little-cores auch ähnlich vorgegangen (außerdem natürlich Featurekürzungen).
        Deshalb wird für die nächsten Intel Chips die speziell für Mobile/Effizienz gedacht sind auch spannend, ob man diesen Weg gehen wird. Lunar Lake soll ja den Gerüchten nach besonders effiziente Ausrichtung genießen
      • Von Bärenmarke BIOS-Overclocker(in)
        Zitat von Rollora
        ich kenne die genauen Ändrrungn m 4c Core noch nicht, es kann aber sein, dass die geringere Größe auch mit der bewussten Ausrichtung quf Effizienz geschehen ist: um auf hohe Frequenzen zu kommen braucht es oft deutlich mehr Transistoren die die elektr. Leistung bei diesen Frequenzen stabil halten. Siehe etwa den Transistorzuwachs bei AMDs Vega.
        Fallen dese weg wird der Core deutlich kleiner, braucht damit nochmal weniger Strom, ist aber nicht mehr so hoch taktbar.
        Neben anderen Änderungen könnte dues der Grund für den kleineren Chipkern sein und erklärt, warum msn nur auf ca 3 Ghz boostet.
        Genau das hat AMD bei der Präsentation erklärt, da der Core mehr auf Effizienz getrimmt ist konnten sie ihn verkleinern und die Transistoren die man für höheren Takt benötigt einsparen.
        Deswegen auch der geringe Boosttakt

        Zitat von Pu244
        2: Sicherheitslücken. Für den Nomalo eher irrelevant, für Cloudanbieter problematisch, da sie dann diese theoretische Sicherheitslücke einräumen müssen. Soweit ich weiß betrifft die SMT ganz generell.
        Das ist ein Grund wieso man dies im Datacenterumfeld oft nicht haben möchte und ARM auch damit wirbt. 1 Core 1 Thread und mit 128 Threads hat man ja auch reichlich würde ich sagen
      • Von Pu244 Kokü-Junkie (m/w)
        Wenn ich mich richtig erinnere, dann sinkt ohne SMT die Effizienz signifikant.

        Es gibt wohl zwei Gründe, die dagegen Sprechen:
        1: Wenn man nicht genug Threads hat, um die CPU auszulasten
        2: Sicherheitslücken. Für den Nomalo eher irrelevant, für Cloudanbieter problematisch, da sie dann diese theoretische Sicherheitslücke einräumen müssen. Soweit ich weiß betrifft die SMT ganz generell.
      • Von PCGH_Dave Lötkolbengott/-göttin
        Zitat von Cleriker
        Trotz des wegfallen von SMT hat die CPU dennoch eine TDP von 360W. War es nicht so, dass SMT knapp 10% der thermischen Emission ausgemacht hat?
        Die TDP hat nichts damit zu tun. Ansonsten hast du recht, ich habs gerade bei meinem 7800X3D mal getestet:

        Ohne/mit SMT, CPU-Z-Stresstest:

        [Ins Forum, um diesen Inhalt zu sehen][Ins Forum, um diesen Inhalt zu sehen]

        Jeder Kern benötigt knapp ein Watt mehr, die PP steigt trotzdem nur um ~10 Prozent an.
      Direkt zum Diskussionsende
  • Print / Abo
    Apps
    PCGH Magazin 07/2026 PC Games 07/2026 play5 07/2026 N-Zone 07/2026 Linux Magazin 07/2026 LinuxUser 07/2026 Raspberry Pi Geek 07/2026
    PC Games Hardware PC Games Linux Magazin Raspberry Pi Geek Computec Kiosk