AMD Zen 4C: Epyc-CPU Bergamo schrumpft Zen-4-Kerne drastisch zusammen

7
News Valentin Sattler Als bevorzugte Quelle auf Google hinzufügen
AMD Zen 4C: Epyc-CPU Bergamo schrumpft Zen-4-Kerne drastisch zusammen
Quelle: AMD

Die Website Semianalysis hat eine detaillierte Analyse veröffentlicht, wie AMD mit Zen 4C die bestehenden Zen-4-Kerne deutlich zusammenschrumpfen konnte. Bei nur einem geringen zusätzlichen Flächenverbrauch, konnte das Unternehmen so doppelt so viele Kerne pro CCD unterbringen.

Während man im Desktop aktuell Ryzen-Prozessoren mit maximal 16 Kernen kaufen kann, bietet AMD für Server-Kunden bereits deutlich mehr an. Die aktuelle Epyc-Generation "Genoa" verfügt bereits über bis zu 96 CPU-Kerne, und mit den für diesen Monaten geplanten Bergamo-Prozessoren sollen es sogar noch mehr werden. Konkret sollen die neuen Modelle bis zu 128 Kerne beinhalten, ohne dabei nennenswert mehr Fläche zu benötigen.

Zen 4C: Auf Kompaktheit getrimmt

Möglich wird das durch eine angepasste CPU-Architektur, die AMD als Zen 4C vermarktet. Diese soll die identischen Fähigkeiten wie Zen 4 haben, aber bei derselben Fertigung auf deutlich weniger Fläche unterkommen. Konkret wächst die Fläche pro CCD (Core Complex Die) zwar von 66,3 auf 72,7 mm², doch gleichzeitig verdoppelt das Unternehmen die Anzahl der Kerne pro Chip auf nunmehr 16 Stück.

Wie AMD das geschafft hat, geht aus einer Analyse der Website Semianalysis hervor. Dabei wird explizit betont, dass im Gegensatz zu Intels P- und E-Kernen keinen Unterschied beim Befehlssatz gibt. Zen 4C funktioniert also tatsächlich genau so wie Zen 4. Ganz ohne Nachteile kommt das kompakte Design aber dennoch nicht aus, was sich beispielsweise am L3-Cache zeigt: Pro CCD ist dieser zwar gleich groß, doch teilen sich damit doppelt so viele CPU-Kerne dieselbe Speichermenge. Bei Cache-intensiven Anwendungen kann Zen 4C damit nicht mithalten.

Architektur Zen 4 Zen 4C
Kerne pro CCD 8 16
Fertigung 5 nm, TSMC 5 nm, TSMC
Fläche pro CCD 66,3 mm² 72,7 mm²
L1-Cache pro Kern 64 KB 64 KB
L2-Cache pro Kern 1 MB 1 MB
L3-Cache pro Kern 4 MB 2 MB

Der L3-Speicher ist aber nicht der einzige Unterschied zwischen Zen 4C und Zen 4, sondern es gibt noch zahlreiche weitere Optimierungen. Beispielsweise fallen im Cache-Bereich die TSVs (Through Silicon Via) weg, mit denen auf Ryzen-Prozessoren ein X3D-Cache betrieben werden kann. Mit Hinblick auf die Kerne selbst half zudem der niedrigere Takt von Zen 4C: Dadurch konnten beispielsweise Signalleitungen mit niedrigeren Anforderungen geplant werden, was unter anderem Pufferspeicher einspart und damit die Fläche reduziert.

Zudem wurde auch das Layout der Kerne überarbeitet. Bei der Entwicklung von CPU-Kernen werden diese üblicherweise in getrennte Funktionsblöcke unterteilt, die von eigenen Entwicklerteams unabhängig bearbeitet werden können. Laut Semianalysis hat AMD für Zen 4C offenbar die Anzahl dieser Blöcke reduziert und damit die Flächenausnutzung optimiert. Eine weitere, deutliche Flächenreduktion gab es außerdem durch ein anderes Layout der SRAM-Speicherzellen: TSMC hat hier ein neues Layout entwickelt, das einen gleichzeitigen Lese- und Schreibzugriff durch eine sequenzielle Ausführung ersetzt. Das ist zwar weniger flexibel, doch wird dafür die notwendige Transistorenzahl pro Bit von 8 auf 6 reduziert.

Ebenso spannend: Fertigung bei TSMC: 2024 soll Preiserhöhungen bringen

Mit Blick auf den insgesamt erreichten Flächenverbrauch ist es zweifellos beeindruckend, wie kompakt AMD Zen 4C durch die Optimierungen gestalten konnte. Allerdings werden diese natürlich durch gewisse Nachteile erkauft, die, wie bereits erwähnt, den Speicher und die Taktraten betreffen. Daher bleibt abzuwarten, inwiefern sich die neuen Bergamo-Prozessoren am Ende wirklich von den bereits erhältlichen Genoa-Modellen mit weniger Kernen absetzen können.

Quelle: Semianalysis via Tom's Hardware

7
    • Kommentare (7)

      Zur Diskussion im Forum
      • Von latiose88 BIOS-Overclocker(in)
        ja das macht durchaus sinn und mit nicht Latenzkritisch meintest du damit die wo von mehr Cache nicht profitiere oder halt nur eher schlecht.Da wird ja gewiss L1,L2 und L3 Cache reduziert worden sein. Bei L2 bin ich schon mal nicht Latenzabhängig gewesen.Mehr Cache brachte 0,bei L1 bin ich mir da nicht so sicher aber bei L3 war es etwas so.Aber nur beim 8 Kerner,also kann man da auch nicht genau sagen ob das auswirkung hat.Durch die weniger Cache aber mehr Kernen dürfte das aufgehoben worden sein.
        Dann noch ne Kombination mit noch mehr Kernen und die meisten sehen da nen Plus am Ende herausstechen.
        So ein Kombi CPU wäre ich durchaus interessiert dran.Weil gegen noch mehr Leistung kann ich ja nix haben.
        Allerdings ist dies ja ne Entscheidung von AMD.Das extra Cache muss jedoch nicht unbedingt sein.
        Durch ne Mischung wird auf jedenfall 24 Logische und 48 Threads in den Pc gepumpt werden.Einen 24 Threadripper CPU wird es dennoch nicht in der Leistung ereichen aber das spielt ja keine Rolle,weil mehr Leistung wird es ja dennoch geben.

        Bei sowas ja wird es vollkommen interessant werden.Aber gut AMD kann es sich ja durchaus noch entscheiden.Mehrkosten entsteht da ja nicht weil braucht ja nicht mehr als 2 Chiplets dafür nur wie immer halt.
      • Von latiose88 BIOS-Overclocker(in)
        ja das macht durchaus sinn und mit nicht Latenzkritisch meintest du damit die wo von mehr Cache nicht profitiere oder halt nur eher schlecht.Da wird ja gewiss L1,L2 und L3 Cache reduziert worden sein. Bei L2 bin ich schon mal nicht Latenzabhängig gewesen.Mehr Cache brachte 0,bei L1 bin ich mir da nicht so sicher aber bei L3 war es etwas so.Aber nur beim 8 Kerner,also kann man da auch nicht genau sagen ob das auswirkung hat.Durch die weniger Cache aber mehr Kernen dürfte das aufgehoben worden sein.
        Dann noch ne Kombination mit noch mehr Kernen und die meisten sehen da nen Plus am Ende herausstechen.
        So ein Kombi CPU wäre ich durchaus interessiert dran.Weil gegen noch mehr Leistung kann ich ja nix haben.
        Allerdings ist dies ja ne Entscheidung von AMD.Das extra Cache muss jedoch nicht unbedingt sein.
        Durch ne Mischung wird auf jedenfall 24 Logische und 48 Threads in den Pc gepumpt werden.Einen 24 Threadripper CPU wird es dennoch nicht in der Leistung ereichen aber das spielt ja keine Rolle,weil mehr Leistung wird es ja dennoch geben.

        Bei sowas ja wird es vollkommen interessant werden.Aber gut AMD kann es sich ja durchaus noch entscheiden.Mehrkosten entsteht da ja nicht weil braucht ja nicht mehr als 2 Chiplets dafür nur wie immer halt.
      • Von PCGH_Torsten Kokü-Junkie (m/w)
        Wurde eigentlich schon bestätigt ob/das Zen 4c mit der gleichen Pipeline-Zahl wie Zen 4 arbeitet? Wie dargelegt, kann man zwar innerhalb eine Fertigungsgeneration durch Wechsel von takt- zu flächenoptimierten Node-Varianten 25 Prozent Platz einsparen. Aber wenn, so wie hier, zum Beispiel die SIMD-Einheit um 50 Prozent schrumpft, wäre es auch naheliegend, weniger Recheneinheiten reinzustecken. Egal ob sämtliche Vertreter von Intels Atom-Line bis zu den heutige E-Cores, ob Bulldozer, ob Netburst – wann immer es das Ziel war, einen kleineren Kern zu bauen, war das bislang Schritt 1 und es erscheint auch sinnvoll für das Anwendungsgebiet: Gut parallelisierbare Aufgaben sind in der Regel nicht latenzkritisch und so ziemlich der einzige Vorteil von massiv superskalaren Kernen gegen mehreren schmalen auf gleicher Fläche ist die effektiv kürzere Wartezeit auf Ergebnisse.
      • Von BigBoymann BIOS-Overclocker(in)
        Zitat von BxBender
        Also wird vielleicht demnächst ein X3D Klotz zusammen mit einem C-Klotz gemeinsam auf einen 8950X3D-C geklöppelt?
        24K, 48T, mehr Kerne, weniger Verbrauch, Hochleistung in Spielen, mehr Leistung auch in Anwendungen, alle sind zufrieden.
        3D Cache wird es auf Zen4C nicht geben, da die Verbindungen um Platz zu sparen nicht existieren.

        Zen4c und Zen 4 werden wohl eher nicht kompatibel sein, wobei interessant wäre der Ansatz.

        Aber der Name ist falsch, wenn dann 7950XT, ist ja Zen4 und Zen4c und nicht Zen 5
      • Von BxBender Volt-Modder(in)
        Also wird vielleicht demnächst ein X3D Klotz zusammen mit einem C-Klotz gemeinsam auf einen 8950X3D-C geklöppelt?
        24K, 48T, mehr Kerne, weniger Verbrauch, Hochleistung in Spielen, mehr Leistung auch in Anwendungen, alle sind zufrieden.
      • Von latiose88 BIOS-Overclocker(in)
        naja also wenn nun die Kern zu Kern Latenz durch näher Rücken sinkt,weil es nicht mehr von Chiplet zu Chiplet Kommikation mehr stattfinden muss,denke mal durch das steigt ja die Leistung auch an.Die Raktion ist ja teilweise durch ms ja sehr hoch.Und wenn man nun nur 16 Kerne maximal verbraucht dann sinkt die Reaktionszeit.
        Bei 32 Kernen braucht es nur noch 2 CHiplets. Wenn nun die Raktionszeit sinkt gegenüber dem vorgänger,vielleicht gibt es ja dann mehr leistung weil die Kerne dann schneller reagieren können.Es dann direkter und besser zusammen Arbeiten.
        Aber nur wenn ne Anwendung nur sehr wenig oder garnicht von mehr Cache Profitiert.Oder da muss immer weniger vorgeladen werden und kann direkter zu den jeweiligen Kernen gelangen.Das wird es sich zeigen.Ich bin gespannt,was dabei am Ende für ne Leistung raus kommt.
        Aber dazu müsste es sich erst mal einer wer das kaufen.Beim Preis wird es auch noch spannend ob das günstiger werden wird.Brauchen die bei so vielen Kernen pro CCD auch weniger Verbindungen.Was ich als vorteil so sehe.
      Direkt zum Diskussionsende
  • Print / Abo
    Apps
    PCGH Magazin 07/2026 PC Games 07/2026 play5 07/2026 N-Zone 07/2026 Linux Magazin 07/2026 LinuxUser 07/2026 Raspberry Pi Geek 07/2026
    PC Games Hardware PC Games Linux Magazin Raspberry Pi Geek Computec Kiosk