CPUs mit Core Ultra 400: Konkretere Hinweise zu Intels X3D-Konkurrenz

News 18.12.2025 um 16:15 Uhr Norman Wittkopf Als bevorzugte Quelle auf Google hinzufügen

Quelle: Sven Bauduin

Mit dem "big Last Level Cache" (BLLC) will Intel bei Nova Lake-S (Core Ultra 400) AMDs X3D-CPUs attackieren. Jetzt gibt es neue Hinweise zu den Modellen.

Intel plant bei den frühestens für Ende 2026 erwarteten Nova-Lake-Prozessoren bekanntlich angeblich mit einer 3D-V-Cache-Konkurrenz namens BLLC und bereits Ende November waren dazu aus der Gerüchteküche mindestens vier entsprechende Desktop-CPUs der designierten Core-Ultra-400K-Reihe für den neuen Sockel LGA1954 aufgetaucht. Jetzt will der für Leaks bekannte X-User @Haze2K1 die potenziellen Kernkonfigurationen der kommenden Desktop-Prozessoren aufgetan haben.

Demnach soll es an der Spitze ein Modell mit 16 Performance-Kernen (P) und 32 Efficiency-Kernen (E) sowie 4 Low-Power-Efficency-Kernen (LPE) geben. Darauf folgen sollen CPUs mit den Kernkonfigurationen 14P + 24E + 4LPE sowie 8P + 16E + 4LPE und 8P + 12E + 4LPE. Der Darstellung nach handelt es sich um die einzigen Nova-Lakes-CPUs mit BLLC, die voraussichtlich als K-Modelle den Modellreihen Core Ultra 9 und Core Ultra 7 angehören dürften.

Empfohlener redaktioneller Inhalt [EMBED_URL] An dieser Stelle finden Sie externe Inhalte von [PLATTFORM]. Zum Schutz Ihrer persönlichen Daten werden externe Einbindungen erst angezeigt, wenn Sie dies durch Klick auf "Alle externen Inhalte laden" bestätigen: Ich bin damit einverstanden, dass mir externe Inhalte angezeigt werden. Damit werden personenbezogene Daten an Drittplattformen übermittelt. Mehr dazu in unserer Datenschutzerklärung.

Externe Inhalte Mehr dazu in unserer Datenschutzerklärung.

Intels X3D-Konkurrenz BLCC: Angeblich nur für K-CPUs

Wie 3DCenter.org hierzu berichtet, soll Intels Core-Ultra-5-Reihe demnach vom BLLC ausgeschlossen sein, was andere Quellen in der Vergangenheit bereits angedeutet hätten. Zudem bleibe noch offen, ob es auch übertaktungsfähige K-Modelle ohne den großen Cache geben wird. Denkbar wäre entsprechend, dass es die Non-K-Modelle sind, die auf den BLLC verzichten. Da Nova Lake allerdings erst frühestens zum Jahresende 2026 erwartet wird, könnte sich daran auch noch etwas ändern, auch wenn das erfahrungsgemäß eher unwahrscheinlich sein soll.

Unterdessen erscheint bei Intel zunächst einmal Anfang nächsten Jahres die mobile Panther-Lake-Generation in Form der Core-Ultra-300-Reihe für Laptops, die sich angeblich mit AMD messen kann. Ebenfalls noch auf dem Plan stehen soll ein Nova-Lake-Refresh unter dem Namen Core Ultra 200(K) Plus, von dem allerdings nach aktuellem Kenntnisstand nicht viel zu erwarten sein soll.

Ihre Meinung ist gefragt!

Was sagen Sie zu den Modellgerüchten bei Intel? Nutzen Sie die Kommentarfunktion und teilen Sie uns Ihre Meinung mit. Beachten Sie beim Kommentieren aber bitte die Forenregeln. Folgen Sie uns außerdem für Neuigkeiten in der Hardware-Welt oder unsere exklusiven Inhalte gern auf Whatsapp und X. Unsere Video-Inhalte (oftmals gewürzt mit einer Prise Humor) finden Sie bei Youtube, Instagram und Tiktok.

Artikel teilen

CPUs mit Core Ultra 400: Konkretere Hinweise zu Intels X3D-Konkurrenz Mit dem "big Last Level Cache" (BLLC) will Intel bei Nova Lake-S (Core Ultra 400) AMDs X3D-CPUs attackieren. Jetzt gibt es neue Hinweise zu den Modellen.

Per E-Mail versenden

- Kommentare (51)
  Zur Diskussion im Forum
  
  Von MechUnit Software-Overclocker(in)
  
  Zitat von Herr_M
  
  Das Offtopic-KI-Geblubber packst du bitte vorbildlich in einen Spoiler und stellst eine eigene Zusammenfassung zur Verfügung. Damit wir es lernen.
  
  Jo, gefixt - damit "wir" (also auch ihr als Mods? ) es lernen
  
  Zitieren
  
  Von MechUnit Software-Overclocker(in)
  
  Zitat von Herr_M
  
  Das Offtopic-KI-Geblubber packst du bitte vorbildlich in einen Spoiler und stellst eine eigene Zusammenfassung zur Verfügung. Damit wir es lernen.
  
  Jo, gefixt - damit "wir" (also auch ihr als Mods? ) es lernen
  
  Zitieren
  
  Von Herr_M Software-Overclocker(in)
  
  Zitat von MechUnit
  
  aber ich kopier mal von Chat-GPT/Copilot, dann muss ich das nicht ewig ausformulieren:
  
  Sorry für den langen Text und für Off Topic!
  
  Das Offtopic-KI-Geblubber packst du bitte vorbildlich in einen Spoiler und stellst eine eigene Zusammenfassung zur Verfügung. Damit wir es lernen.
  
  Zitieren
  
  Von Pokerclock Kokü-Junkie (m/w)
  
  Ich weiß nicht, ob sich Intel einen Gefallen tut, mit der Kern-Zerstückelung seiner CPUs. Das mag im Mobil-Bereich effizient und nützlich sein, aber im Desktop-Bereich möchte der Anwender gerne nachvollziehbare und konsistente Leistung haben. Kunden von mir haben sich schon gegen Intel und für AMD entscheiden, einfach weil nach 8 P-Kernen die Leistung abgeflaut ist. Bei AMD bekommt man bei einem 9950X eben 16x das Gleiche. Ideal für das Ausführen mehrerer Instanzen einer Software, die ab 4-6 Threads keinen Nutzen mehr zieht.
  
  Intel müsste sein Portfolio komplett anders gestalten:
  
  Dicker Mehrkerner mit möglichst vielen P-Kernen, Takt und TDP jenseits von Gut und Böse
  8-12 Kerner Monolith mit überfetten Cache für die Gamer
  Mittelklasse Allrounder mit von mir aus Kern-Zerstückelung des Todes.
  Einsteiger-CPUs, wo es eh nahezu egal ist, Hauptsache mehr als 2 Kerne...
  
  Aber pauschal das Topmodell aka U9/i9 oder whatever9 mit allem ausstatten, was man sich denken kann? Das ist der falsche Weg. CPUs bitte nach Zielgruppe entwickeln und nicht nach einem rückständigen Aufzählungssystem alla Pentium, 3, 5, 7 und 9.
  
  Zitieren
  
  Von PCGH_Torsten Kokü-Junkie (m/w)
  
  Zitat von Dreak77
  
  P- Kerne, E-Kerne und jetzt noch LPE-Kerne und dann eben Intels Cachevariante... Softwareentwickler lieben es habe ich mir sagen lassen, wer hat denn da noch Bock für die Kernverwaltung noch optimieren zu müssen?
  
  Intels Empfehlung an die Software-Entwickler lautet seit nunmehr über vier Jahren: Lasst die Finger davon!
  Und die P/E/LPE-Compo verkauft Intel jetzt auch schon seit Meteor Lake Ende 2023.
  Details soll der Thread-Director regeln und Probleme entstehen in erster Linie dann, wenn sich ein Spiel einmischt und Last fix auf einen Kern mit Nummer X legt, egal was dieser Kern kann. Vereinzelt gibt es auch Probleme, wenn ein Spiel ohne Ende Threads spawnt, die jeder kaum etwas zu tun haben. Aber auch das ist keine CPU-spezifisches Problem; wenn der Verwaltungsoverhead mehr Leistung auf dem Hauptthread frisst als durch die Auslagerung der eigentlichen Berechnungen auf andere Kerne frei wird oder wenn extrem viele Recheneinheiten zusätzlich belegt um mit "Multi Core" zu werben, obwohl die Performance sowieso an einem Mainthread und somit am maximalen (Oligo-Core-)Boost-Takt hängt, dann ist das einfach schlechte Programmierung.
  
  Zitat von Incredible Alk
  
  Das ist gerüchteweise beim kommenden Sockel sogar geplant. Obs wirklich so kommt wird man sehen müssen aber Intel scheint von der "alle 2 Jahre neuer Sockel"-Nummer wegzukommen.
  
  Sockel 1700 hielt ja schon drei Jahre und wenn NVL sich auf Anfang 2027 verschiebt, dann wird auch der 1851 älter als 24 Monate.
  Das nützt aber erst etwas, wenn Intel innerhalb eines Sockels auch deutliche Architekturweiterentwicklungen oder zumindest eine drastische Steigerung der Ausführungseinheiten anbietet. Das gab es aber seit der Einführung von IMCs bei Intel allenfalls im 1366. (+50 Prozent Kerne sowie etwas mehr Cache und Takt.)
  
  Zitat von Incredible Alk
  
  Den genauen Grund kann ich dir aus der Ferne nicht sagen. Avx Einheiten sind extrem schnell wenn gut ausgenutzt aber benötigen dafür auch mehr Strom. Wenn eine CPU sowieso schon im Powerlimit ist und dann avx kommt muss sie generell mit dem Takt weiter runter. AXV macht schneller, weniger möglicher Takt der restlichen CPU macht langsamer. Wie der Tradeoff insgesamt ausgeht ist vom konkreten Fall abhängig, wobei es tendenziell schneller wird bei viel avx Code und langsamer werden kann wenn nur sehr wenig AVX code kommt.
  
  Der Grund ist simpel: Doppelt so breite SIMD-Einheiten können zwar doppelt so viel (synthetische) Arbeit bei gleichem Takt erledigen, der Teil der CPU verbrät dann aber auch doppelt so viel Energie und das sprengt jede TDP. Bevor es intelligente, Package-Power-folgende Turbomechanismen gab, musste also der Takt drastisch runter. Damit stieg die Effizienz, sodass unterm Strich immer noch ein ordentliches Leistungsplus bei Nutzung des neuen Formats blieb, aber alter Code sah halt nur eine lahme, untertaktete CPU => lohnt sich erst, wenn man einen hinreichend großen Anteil neuer Befehle im Code hat.
  
  Zitieren
  
  Von MechUnit Software-Overclocker(in)
  
  Zitat von Quake2008
  
  Rendern in Blender ab und zu. Aber ich brauche viele Kerne auch für Physik spielereien.
  
  Ah, verstehe.
  
  Zitat von Quake2008
  
  Genau genommen rendert eine CPU genauer, so hab ich das noch in erinnerung.
  
  Es gab auch mit CPU's schon immer Rechenungenauigkeiten aufgrund von Gleitkommazahlen. Das gesammte Rendering basiert besonders darauf. Im Endeffekt hast du schon recht, aber ich kopier mal von Chat-GPT/Copilot, dann muss ich das nicht ewig ausformulieren:
  
  [Ins Forum, um diesen Inhalt zu sehen]
  [Ins Forum, um diesen Inhalt zu sehen]
  Alle modernen CPUs — egal ob Consumer oder Workstation — nutzen den IEEE‑754‑Standard für Floating‑Point‑Zahlen. Dieser Standard ist extrem weit verbreitet.
  Das Problem: Viele Dezimalzahlen lassen sich nicht exakt in Binärform darstellen. Beispiel: 0,1 → unendliche Binärbruchdarstellung → muss gerundet werden.
  Dadurch entstehen:
  
  Rundungsfehler
  Akkumulationsfehler (Fehler summieren sich über viele Operationen)
  Abweichungen bei sehr kleinen oder sehr großen Werten
  
  Diese Effekte sind unvermeidbar — selbst Supercomputer haben sie.
  [Ins Forum, um diesen Inhalt zu sehen]
  Rendering-Engines führen Milliarden von Floating‑Point‑Operationen aus:
  
  Matrixmultiplikationen
  Transformationen
  Normalenberechnungen
  Ray‑Intersection‑Tests
  Shader‑Berechnungen
  
  Jede Operation enthält eine winzige Ungenauigkeit. Viele Operationen hintereinander → Fehler wachsen.
  [Ins Forum, um diesen Inhalt zu sehen]
  Nicht weil sie „schlechter“ rechnen — sondern weil sie weniger Präzision und weniger deterministische Hardware nutzen als professionelle HPC‑ oder Server‑CPUs.
  [Ins Forum, um diesen Inhalt zu sehen]
  Rendering‑Engines (Blender, Unreal, Unity, Arnold, Cycles, etc.) arbeiten überwiegend mit:
  
  float32 (Single Precision) → 7 Dezimalstellen Genauigkeit
  
  Workstation‑/HPC‑CPUs und wissenschaftliche Software nutzen dagegen oft:
  
  float64 (Double Precision) → 15–16 Dezimalstellen Genauigkeit
  
  Consumer‑CPUs können double, aber:
  
  es ist langsamer
  es verbraucht mehr Speicher
  Engines optimieren auf Performance, nicht auf wissenschaftliche Präzision
  
  [Ins Forum, um diesen Inhalt zu sehen]
  CPUs nutzen aggressive Optimierungen:
  
  Out‑of‑order execution
  SIMD‑Vektorisierung (SSE, AVX)
  Fused Multiply Add (FMA)
  Register‑Breite vs. Speicher‑Breite
  
  Diese Optimierungen können zu leicht unterschiedlichen Ergebnissen führen — selbst bei identischem Code.
  [Ins Forum, um diesen Inhalt zu sehen]
  Beim Rendering laufen Threads parallel:
  
  Jeder Thread berechnet Pixel oder Rays unabhängig
  Reihenfolge der Operationen ist nicht garantiert
  Floating‑Point‑Addition ist nicht kommutativ (a+b ≠ b+a bei floats)
  
  → Das führt zu minimal unterschiedlichen Ergebnissen zwischen Render‑Runs.
  [Ins Forum, um diesen Inhalt zu sehen]
  [Ins Forum, um diesen Inhalt zu sehen]
  [Ins Forum, um diesen Inhalt zu sehen]
  
  Engines nutzen float32, weil Consumer‑Hardware darauf optimiert ist
  Consumer‑CPUs haben weniger FP‑Einheiten als Workstation‑CPUs
  Consumer‑CPUs haben weniger deterministische FPU‑Pipelines
  Consumer‑CPUs haben weniger Cache, was zu mehr Speicher‑Rundungen führt
  
  Aber: Die mathematische Ungenauigkeit ist bei allen CPUs gleich — nur die Häufigkeit und Sichtbarkeit variiert.
  [Ins Forum, um diesen Inhalt zu sehen]
  Rechenungenauigkeiten beim 3D‑Rendering entstehen durch:
  
  den IEEE‑754‑Standard selbst
  Rundungsfehler bei Floating‑Point‑Operationen
  massive Anzahl an Berechnungen
  Multithreading
  Optimierungen der CPU‑Architektur
  
  Consumer‑CPUs sind nicht „ungenauer“, aber Rendering‑Engines nutzen Präzisionsmodi, die auf Consumer‑Performance optimiert sind — und dadurch treten die Fehler stärker hervor.
  
  [Ins Forum, um diesen Inhalt zu sehen]
  [Ins Forum, um diesen Inhalt zu sehen]
  Sowohl CPUs als auch GPUs verwenden den IEEE‑754‑Standard für Gleitkommazahlen. Das bedeutet:
  
  Beide haben dieselben fundamentalen Rundungsfehler
  Beide können float32, float64 usw.
  Beide sind prinzipiell gleich präzise
  
  Das bestätigt NVIDIA ausdrücklich: GPUs implementieren denselben Standard wie CPUs.
  [Ins Forum, um diesen Inhalt zu sehen]
  [Ins Forum, um diesen Inhalt zu sehen]
  Rendering‑Engines auf GPUs nutzen überwiegend:
  
  float32 → ca. 7 Dezimalstellen Genauigkeit
  
  Double Precision (float64) ist auf GPUs:
  
  viel langsamer
  oft künstlich gedrosselt (besonders bei Consumer‑GPUs)
  in vielen Shader‑Pipelines gar nicht verfügbar
  
  CPUs hingegen rechnen intern oft mit höherer Präzision, selbst wenn der Code float32 sagt.
  [Ins Forum, um diesen Inhalt zu sehen]
  GPUs nutzen extrem aggressive Optimierungen:
  
  FMA (Fused Multiply Add)
  massive Parallelisierung
  approximative Funktionen (sin, cos, exp)
  Compiler‑Flags wie [Ins Forum, um diesen Inhalt zu sehen] (führt zu weniger präzisen Ergebnissen)
  
  Viele GPU‑Shader‑Funktionen sind nicht vollständig IEEE‑konform, weil Performance wichtiger ist als absolute Genauigkeit.
  [Ins Forum, um diesen Inhalt zu sehen]
  Durch die extreme Parallelität:
  
  Reihenfolge der Operationen ist nicht garantiert
  Floating‑Point‑Addition ist nicht assoziativ
  Ergebnisse können zwischen Runs leicht variieren
  
  Das ist bei CPUs deutlich seltener.
  [Ins Forum, um diesen Inhalt zu sehen]
  [Ins Forum, um diesen Inhalt zu sehen]
  [Ins Forum, um diesen Inhalt zu sehen]
  
  Ray‑Tracing (Monte‑Carlo‑Noise dominiert ohnehin)
  Rasterisierung (Z‑Buffer‑Fehler sind normal)
  Echtzeit‑Rendering (Performance > Präzision)
  Denoising / AI‑Upscaling (Fehler werden kaschiert)
  
  Für visuelle Ergebnisse reicht float32 fast immer.
  [Ins Forum, um diesen Inhalt zu sehen]
  GPUs sind nicht genauer als CPUs — im Gegenteil. Sie sind:
  
  schneller
  massiv parallel
  aber weniger präzise
  und weniger deterministisch
  
  Die Ungenauigkeiten sind aber in der Praxis meist irrelevant, weil Rendering visuell tolerant ist und Fehler durch Noise, Denoiser und Sampling überdeckt werden.
  
  Mit dem Fazit kann man also sagen: mit der Monte Carlo-Methode (ist mit der CPU die mit Abstand langsamste, liefert aber die optisch besten Ergebnisse) und durch Noises/Denoiser/Sampling kann man die Fehler gut kaschieren.
  
  Somit bleibt, obwohl du recht hast, unterm Strich die GPU fürs 3D-Rendering das MIttel der Wahl, vor allem mit Workstation-GPU, die da ja ohnehin genauer arbeitet als eine 0815 Standard Gamer-GPU. Vor allem tritt beim CPU-Rendering der Light Leak Error sehr häufig auf und den zu fixen, bedeutet oft aufwendiges friemeln an der Szene und den Rendereinstellungen, was dann an anderer Stelle für unbefriedigende Renderergebnisse sorgen kann.
  
  Zitieren
  
  Direkt zum Diskussionsende

Hoch

Print / Abo

Apps

Die Redaktion Datenschutz Artikel-Archiv Datenschutz-Optionen Mediadaten Impressum Utiq verwalten Abo kündigen Vertrag widerrufen AGB Inhalt melden Newsletter

Intels X3D-Konkurrenz BLCC: Angeblich nur für K-CPUs

Ihre Meinung ist gefragt!

Artikel teilen

Kommentare (51)