CPUs mit Core Ultra 400: Konkretere Hinweise zu Intels X3D-Konkurrenz

51
News Norman Wittkopf Als bevorzugte Quelle auf Google hinzufügen
CPUs mit Core Ultra 400: Konkretere Hinweise zu Intels X3D-Konkurrenz
Quelle: Sven Bauduin

Mit dem "big Last Level Cache" (BLLC) will Intel bei Nova Lake-S (Core Ultra 400) AMDs X3D-CPUs attackieren. Jetzt gibt es neue Hinweise zu den Modellen.

Intel plant bei den frühestens für Ende 2026 erwarteten Nova-Lake-Prozessoren bekanntlich angeblich mit einer 3D-V-Cache-Konkurrenz namens BLLC und bereits Ende November waren dazu aus der Gerüchteküche mindestens vier entsprechende Desktop-CPUs der designierten Core-Ultra-400K-Reihe für den neuen Sockel LGA1954 aufgetaucht. Jetzt will der für Leaks bekannte X-User @Haze2K1 die potenziellen Kernkonfigurationen der kommenden Desktop-Prozessoren aufgetan haben.

Demnach soll es an der Spitze ein Modell mit 16 Performance-Kernen (P) und 32 Efficiency-Kernen (E) sowie 4 Low-Power-Efficency-Kernen (LPE) geben. Darauf folgen sollen CPUs mit den Kernkonfigurationen 14P + 24E + 4LPE sowie 8P + 16E + 4LPE und 8P + 12E + 4LPE. Der Darstellung nach handelt es sich um die einzigen Nova-Lakes-CPUs mit BLLC, die voraussichtlich als K-Modelle den Modellreihen Core Ultra 9 und Core Ultra 7 angehören dürften.

Empfohlener redaktioneller Inhalt [EMBED_URL] An dieser Stelle finden Sie externe Inhalte von [PLATTFORM]. Zum Schutz Ihrer persönlichen Daten werden externe Einbindungen erst angezeigt, wenn Sie dies durch Klick auf "Alle externen Inhalte laden" bestätigen: Ich bin damit einverstanden, dass mir externe Inhalte angezeigt werden. Damit werden personenbezogene Daten an Drittplattformen übermittelt. Mehr dazu in unserer Datenschutzerklärung.
Externe Inhalte Mehr dazu in unserer Datenschutzerklärung.

Intels X3D-Konkurrenz BLCC: Angeblich nur für K-CPUs

Wie 3DCenter.org hierzu berichtet, soll Intels Core-Ultra-5-Reihe demnach vom BLLC ausgeschlossen sein, was andere Quellen in der Vergangenheit bereits angedeutet hätten. Zudem bleibe noch offen, ob es auch übertaktungsfähige K-Modelle ohne den großen Cache geben wird. Denkbar wäre entsprechend, dass es die Non-K-Modelle sind, die auf den BLLC verzichten. Da Nova Lake allerdings erst frühestens zum Jahresende 2026 erwartet wird, könnte sich daran auch noch etwas ändern, auch wenn das erfahrungsgemäß eher unwahrscheinlich sein soll.

Unterdessen erscheint bei Intel zunächst einmal Anfang nächsten Jahres die mobile Panther-Lake-Generation in Form der Core-Ultra-300-Reihe für Laptops, die sich angeblich mit AMD messen kann. Ebenfalls noch auf dem Plan stehen soll ein Nova-Lake-Refresh unter dem Namen Core Ultra 200(K) Plus, von dem allerdings nach aktuellem Kenntnisstand nicht viel zu erwarten sein soll.

Ihre Meinung ist gefragt!

Was sagen Sie zu den Modellgerüchten bei Intel? Nutzen Sie die Kommentarfunktion und teilen Sie uns Ihre Meinung mit. Beachten Sie beim Kommentieren aber bitte die Forenregeln. Folgen Sie uns außerdem für Neuigkeiten in der Hardware-Welt oder unsere exklusiven Inhalte gern auf Whatsapp und X. Unsere Video-Inhalte (oftmals gewürzt mit einer Prise Humor) finden Sie bei Youtube, Instagram und Tiktok.

51
    • Kommentare (51)

      Zur Diskussion im Forum
      • Von MechUnit Software-Overclocker(in)
        Zitat von Herr_M
        Das Offtopic-KI-Geblubber packst du bitte vorbildlich in einen Spoiler und stellst eine eigene Zusammenfassung zur Verfügung. Damit wir es lernen.
        Jo, gefixt - damit "wir" (also auch ihr als Mods? ) es lernen
      • Von MechUnit Software-Overclocker(in)
        Zitat von Herr_M
        Das Offtopic-KI-Geblubber packst du bitte vorbildlich in einen Spoiler und stellst eine eigene Zusammenfassung zur Verfügung. Damit wir es lernen.
        Jo, gefixt - damit "wir" (also auch ihr als Mods? ) es lernen
      • Von Herr_M Software-Overclocker(in)
        Zitat von MechUnit
        aber ich kopier mal von Chat-GPT/Copilot, dann muss ich das nicht ewig ausformulieren:

        Sorry für den langen Text und für Off Topic!
        Das Offtopic-KI-Geblubber packst du bitte vorbildlich in einen Spoiler und stellst eine eigene Zusammenfassung zur Verfügung. Damit wir es lernen.
      • Von Pokerclock Kokü-Junkie (m/w)
        Ich weiß nicht, ob sich Intel einen Gefallen tut, mit der Kern-Zerstückelung seiner CPUs. Das mag im Mobil-Bereich effizient und nützlich sein, aber im Desktop-Bereich möchte der Anwender gerne nachvollziehbare und konsistente Leistung haben. Kunden von mir haben sich schon gegen Intel und für AMD entscheiden, einfach weil nach 8 P-Kernen die Leistung abgeflaut ist. Bei AMD bekommt man bei einem 9950X eben 16x das Gleiche. Ideal für das Ausführen mehrerer Instanzen einer Software, die ab 4-6 Threads keinen Nutzen mehr zieht.

        Intel müsste sein Portfolio komplett anders gestalten:

        Dicker Mehrkerner mit möglichst vielen P-Kernen, Takt und TDP jenseits von Gut und Böse
        8-12 Kerner Monolith mit überfetten Cache für die Gamer
        Mittelklasse Allrounder mit von mir aus Kern-Zerstückelung des Todes.
        Einsteiger-CPUs, wo es eh nahezu egal ist, Hauptsache mehr als 2 Kerne...

        Aber pauschal das Topmodell aka U9/i9 oder whatever9 mit allem ausstatten, was man sich denken kann? Das ist der falsche Weg. CPUs bitte nach Zielgruppe entwickeln und nicht nach einem rückständigen Aufzählungssystem alla Pentium, 3, 5, 7 und 9.
      • Von PCGH_Torsten Kokü-Junkie (m/w)
        Zitat von Dreak77
        P- Kerne, E-Kerne und jetzt noch LPE-Kerne und dann eben Intels Cachevariante... Softwareentwickler lieben es habe ich mir sagen lassen, wer hat denn da noch Bock für die Kernverwaltung noch optimieren zu müssen?
        Intels Empfehlung an die Software-Entwickler lautet seit nunmehr über vier Jahren: Lasst die Finger davon!
        Und die P/E/LPE-Compo verkauft Intel jetzt auch schon seit Meteor Lake Ende 2023.
        Details soll der Thread-Director regeln und Probleme entstehen in erster Linie dann, wenn sich ein Spiel einmischt und Last fix auf einen Kern mit Nummer X legt, egal was dieser Kern kann. Vereinzelt gibt es auch Probleme, wenn ein Spiel ohne Ende Threads spawnt, die jeder kaum etwas zu tun haben. Aber auch das ist keine CPU-spezifisches Problem; wenn der Verwaltungsoverhead mehr Leistung auf dem Hauptthread frisst als durch die Auslagerung der eigentlichen Berechnungen auf andere Kerne frei wird oder wenn extrem viele Recheneinheiten zusätzlich belegt um mit "Multi Core" zu werben, obwohl die Performance sowieso an einem Mainthread und somit am maximalen (Oligo-Core-)Boost-Takt hängt, dann ist das einfach schlechte Programmierung.

        Zitat von Incredible Alk
        Das ist gerüchteweise beim kommenden Sockel sogar geplant. Obs wirklich so kommt wird man sehen müssen aber Intel scheint von der "alle 2 Jahre neuer Sockel"-Nummer wegzukommen.
        Sockel 1700 hielt ja schon drei Jahre und wenn NVL sich auf Anfang 2027 verschiebt, dann wird auch der 1851 älter als 24 Monate.
        Das nützt aber erst etwas, wenn Intel innerhalb eines Sockels auch deutliche Architekturweiterentwicklungen oder zumindest eine drastische Steigerung der Ausführungseinheiten anbietet. Das gab es aber seit der Einführung von IMCs bei Intel allenfalls im 1366. (+50 Prozent Kerne sowie etwas mehr Cache und Takt.)

        Zitat von Incredible Alk
        Den genauen Grund kann ich dir aus der Ferne nicht sagen. Avx Einheiten sind extrem schnell wenn gut ausgenutzt aber benötigen dafür auch mehr Strom. Wenn eine CPU sowieso schon im Powerlimit ist und dann avx kommt muss sie generell mit dem Takt weiter runter. AXV macht schneller, weniger möglicher Takt der restlichen CPU macht langsamer. Wie der Tradeoff insgesamt ausgeht ist vom konkreten Fall abhängig, wobei es tendenziell schneller wird bei viel avx Code und langsamer werden kann wenn nur sehr wenig AVX code kommt.
        Der Grund ist simpel: Doppelt so breite SIMD-Einheiten können zwar doppelt so viel (synthetische) Arbeit bei gleichem Takt erledigen, der Teil der CPU verbrät dann aber auch doppelt so viel Energie und das sprengt jede TDP. Bevor es intelligente, Package-Power-folgende Turbomechanismen gab, musste also der Takt drastisch runter. Damit stieg die Effizienz, sodass unterm Strich immer noch ein ordentliches Leistungsplus bei Nutzung des neuen Formats blieb, aber alter Code sah halt nur eine lahme, untertaktete CPU => lohnt sich erst, wenn man einen hinreichend großen Anteil neuer Befehle im Code hat.
      • Von MechUnit Software-Overclocker(in)
        Zitat von Quake2008
        Rendern in Blender ab und zu. Aber ich brauche viele Kerne auch für Physik spielereien.
        Ah, verstehe.

        Zitat von Quake2008
        Genau genommen rendert eine CPU genauer, so hab ich das noch in erinnerung.
        Es gab auch mit CPU's schon immer Rechenungenauigkeiten aufgrund von Gleitkommazahlen. Das gesammte Rendering basiert besonders darauf. Im Endeffekt hast du schon recht, aber ich kopier mal von Chat-GPT/Copilot, dann muss ich das nicht ewig ausformulieren:



        [Ins Forum, um diesen Inhalt zu sehen]
        [Ins Forum, um diesen Inhalt zu sehen]
        Alle modernen CPUs — egal ob Consumer oder Workstation — nutzen den IEEE‑754‑Standard für Floating‑Point‑Zahlen. Dieser Standard ist extrem weit verbreitet.
        Das Problem: Viele Dezimalzahlen lassen sich nicht exakt in Binärform darstellen. Beispiel: 0,1 → unendliche Binärbruchdarstellung → muss gerundet werden.
        Dadurch entstehen:

        Rundungsfehler
        Akkumulationsfehler (Fehler summieren sich über viele Operationen)
        Abweichungen bei sehr kleinen oder sehr großen Werten

        Diese Effekte sind unvermeidbar — selbst Supercomputer haben sie.
        [Ins Forum, um diesen Inhalt zu sehen]
        Rendering-Engines führen Milliarden von Floating‑Point‑Operationen aus:

        Matrixmultiplikationen
        Transformationen
        Normalenberechnungen
        Ray‑Intersection‑Tests
        Shader‑Berechnungen

        Jede Operation enthält eine winzige Ungenauigkeit. Viele Operationen hintereinander → Fehler wachsen.
        [Ins Forum, um diesen Inhalt zu sehen]
        Nicht weil sie „schlechter“ rechnen — sondern weil sie weniger Präzision und weniger deterministische Hardware nutzen als professionelle HPC‑ oder Server‑CPUs.
        [Ins Forum, um diesen Inhalt zu sehen]
        Rendering‑Engines (Blender, Unreal, Unity, Arnold, Cycles, etc.) arbeiten überwiegend mit:

        float32 (Single Precision) → 7 Dezimalstellen Genauigkeit

        Workstation‑/HPC‑CPUs und wissenschaftliche Software nutzen dagegen oft:

        float64 (Double Precision) → 15–16 Dezimalstellen Genauigkeit

        Consumer‑CPUs können double, aber:

        es ist langsamer
        es verbraucht mehr Speicher
        Engines optimieren auf Performance, nicht auf wissenschaftliche Präzision

        [Ins Forum, um diesen Inhalt zu sehen]
        CPUs nutzen aggressive Optimierungen:

        Out‑of‑order execution
        SIMD‑Vektorisierung (SSE, AVX)
        Fused Multiply Add (FMA)
        Register‑Breite vs. Speicher‑Breite

        Diese Optimierungen können zu leicht unterschiedlichen Ergebnissen führen — selbst bei identischem Code.
        [Ins Forum, um diesen Inhalt zu sehen]
        Beim Rendering laufen Threads parallel:

        Jeder Thread berechnet Pixel oder Rays unabhängig
        Reihenfolge der Operationen ist nicht garantiert
        Floating‑Point‑Addition ist nicht kommutativ (a+b ≠ b+a bei floats)

        → Das führt zu minimal unterschiedlichen Ergebnissen zwischen Render‑Runs.
        [Ins Forum, um diesen Inhalt zu sehen]
        [Ins Forum, um diesen Inhalt zu sehen]
        [Ins Forum, um diesen Inhalt zu sehen]

        Engines nutzen float32, weil Consumer‑Hardware darauf optimiert ist
        Consumer‑CPUs haben weniger FP‑Einheiten als Workstation‑CPUs
        Consumer‑CPUs haben weniger deterministische FPU‑Pipelines
        Consumer‑CPUs haben weniger Cache, was zu mehr Speicher‑Rundungen führt

        Aber: Die mathematische Ungenauigkeit ist bei allen CPUs gleich — nur die Häufigkeit und Sichtbarkeit variiert.
        [Ins Forum, um diesen Inhalt zu sehen]
        Rechenungenauigkeiten beim 3D‑Rendering entstehen durch:

        den IEEE‑754‑Standard selbst
        Rundungsfehler bei Floating‑Point‑Operationen
        massive Anzahl an Berechnungen
        Multithreading
        Optimierungen der CPU‑Architektur

        Consumer‑CPUs sind nicht „ungenauer“, aber Rendering‑Engines nutzen Präzisionsmodi, die auf Consumer‑Performance optimiert sind — und dadurch treten die Fehler stärker hervor.

        [Ins Forum, um diesen Inhalt zu sehen]
        [Ins Forum, um diesen Inhalt zu sehen]
        Sowohl CPUs als auch GPUs verwenden den IEEE‑754‑Standard für Gleitkommazahlen. Das bedeutet:

        Beide haben dieselben fundamentalen Rundungsfehler
        Beide können float32, float64 usw.
        Beide sind prinzipiell gleich präzise

        Das bestätigt NVIDIA ausdrücklich: GPUs implementieren denselben Standard wie CPUs.
        [Ins Forum, um diesen Inhalt zu sehen]
        [Ins Forum, um diesen Inhalt zu sehen]
        Rendering‑Engines auf GPUs nutzen überwiegend:

        float32 → ca. 7 Dezimalstellen Genauigkeit

        Double Precision (float64) ist auf GPUs:

        viel langsamer
        oft künstlich gedrosselt (besonders bei Consumer‑GPUs)
        in vielen Shader‑Pipelines gar nicht verfügbar

        CPUs hingegen rechnen intern oft mit höherer Präzision, selbst wenn der Code float32 sagt.
        [Ins Forum, um diesen Inhalt zu sehen]
        GPUs nutzen extrem aggressive Optimierungen:

        FMA (Fused Multiply Add)
        massive Parallelisierung
        approximative Funktionen (sin, cos, exp)
        Compiler‑Flags wie [Ins Forum, um diesen Inhalt zu sehen] (führt zu weniger präzisen Ergebnissen)

        Viele GPU‑Shader‑Funktionen sind nicht vollständig IEEE‑konform, weil Performance wichtiger ist als absolute Genauigkeit.
        [Ins Forum, um diesen Inhalt zu sehen]
        Durch die extreme Parallelität:

        Reihenfolge der Operationen ist nicht garantiert
        Floating‑Point‑Addition ist nicht assoziativ
        Ergebnisse können zwischen Runs leicht variieren

        Das ist bei CPUs deutlich seltener.
        [Ins Forum, um diesen Inhalt zu sehen]
        [Ins Forum, um diesen Inhalt zu sehen]
        [Ins Forum, um diesen Inhalt zu sehen]

        Ray‑Tracing (Monte‑Carlo‑Noise dominiert ohnehin)
        Rasterisierung (Z‑Buffer‑Fehler sind normal)
        Echtzeit‑Rendering (Performance > Präzision)
        Denoising / AI‑Upscaling (Fehler werden kaschiert)

        Für visuelle Ergebnisse reicht float32 fast immer.
        [Ins Forum, um diesen Inhalt zu sehen]
        GPUs sind nicht genauer als CPUs — im Gegenteil. Sie sind:

        schneller
        massiv parallel
        aber weniger präzise
        und weniger deterministisch

        Die Ungenauigkeiten sind aber in der Praxis meist irrelevant, weil Rendering visuell tolerant ist und Fehler durch Noise, Denoiser und Sampling überdeckt werden.

        Mit dem Fazit kann man also sagen: mit der Monte Carlo-Methode (ist mit der CPU die mit Abstand langsamste, liefert aber die optisch besten Ergebnisse) und durch Noises/Denoiser/Sampling kann man die Fehler gut kaschieren.

        Somit bleibt, obwohl du recht hast, unterm Strich die GPU fürs 3D-Rendering das MIttel der Wahl, vor allem mit Workstation-GPU, die da ja ohnehin genauer arbeitet als eine 0815 Standard Gamer-GPU. Vor allem tritt beim CPU-Rendering der Light Leak Error sehr häufig auf und den zu fixen, bedeutet oft aufwendiges friemeln an der Szene und den Rendereinstellungen, was dann an anderer Stelle für unbefriedigende Renderergebnisse sorgen kann.
      Direkt zum Diskussionsende
  • Print / Abo
    Apps
    PCGH Magazin 07/2026 PC Games 07/2026 play5 07/2026 N-Zone 07/2026 Linux Magazin 07/2026 LinuxUser 07/2026 Raspberry Pi Geek 07/2026
    PC Games Hardware PC Games Linux Magazin Raspberry Pi Geek Computec Kiosk