Intels CPU-Architektur: Einblicke der ehemaligen Chefentwicklerin - Temperatur als Problem

9
News Valentin Sattler Als bevorzugte Quelle auf Google hinzufügen
Intels CPU-Architektur: Einblicke der ehemaligen Chefentwicklerin - Temperatur als Problem
Quelle: Intel

Debbie Marr, ehemalige CPU-Architektur-Chefin bei Intel, hat Details über die Probleme und Lösungen in der Entwicklung verraten. Besonders kritisch ist demnach die rasante Temperaturentwicklung.

Mit Ahead Computing war dieses Jahr auch ein kleineres Unternehmen auf der Halbleitermesse IEDM aktiv und beleuchtete in einem Paper die wichtigsten Eckpunkte moderner CPU-Designs. Spannend dabei ist, von wem die Informationen stammen: Autorin ist Debbie Marr. Diese ist CEO von Ahead Computing, sie war aber ab 1988 bei Intel tätig. Seit 1992 wirkte sie an verschiedenen CPU-Architekturen mit, und von 2019 bis Juli 2024 war sie sogar als leitende Managerin für die Architekturentwicklung verantwortlich. Ihre Handschrift prägt also alle aktuellen Intel-Prozessoren - und wohl auch noch die kommenden Generationen.

Weg mit der Wärme

Das Paper gibt damit einen guten Einblick, wie und warum Intel so vorgeht, wie es das Unternehmen derzeit tut. Das von Marr beschriebene, grundlegende Problem ist aber allgemeingültig. Demnach wurde die Rechenleistung von Prozessoren früher vorwiegend durch die Anzahl und Schaltgeschwindigkeit der Transistoren begrenzt. Inzwischen ist das größte Problem aber die Temperaturentwicklung. Durch hohe Integrationsdichten und die Zunahme von 3D-Designs wird es immer wichtiger, die entstehende Hitze im Blick zu behalten.

Bis grob zur Jahrtausendwende stieg die Leistungsdichte in CPUs exponentiell an. Seitdem ist die Wärmeentwicklung ein zunehmendes Problem. Quelle: Debbie Marr Bis grob zur Jahrtausendwende stieg die Leistungsdichte in CPUs exponentiell an. Seitdem ist die Wärmeentwicklung ein zunehmendes Problem. Schon 1999 erreichte die Wärmedichte in Prozessoren angeblich das Niveau einer Kochplatte, und seitdem wurde es noch schlimmer. Gleichzeitig bleibt angesichts der hohen Ströme auf winzigem Raum kaum Reaktionszeit; die Temperatur kann rasant ansteigen und hohe Werte erreichen. Wasserkühlungen oder Vapor Chambers können zwar helfen, das Problem aber nicht lösen.

Deshalb ist laut Marr ein intelligentes Design notwendig. Die Entwickler versuchen, energiehungrige Schaltwerke neben sparsamen Bereichen zu platzieren, oder besonders kritische Bereiche doppelt zu verbauen und abwechselnd anzusprechen. Teils werden Schaltungen auch absichtlich größer ausgelegt, damit sich die Hitze besser verteilt. Lösen ließe sich das alles zwar durch niedrigere Verbrauchswerte der Transistoren, doch diese würden die Hersteller wohl nur für höhere Taktraten nutzen und dann wieder vor demselben Problem stehen.

Eine bessere Fertigung ermöglicht tendenziell mehr Leistung bei weniger Verbrauch (links). Bei einer besseren Architektur wird das Performance-Plus hingegen durch einen höheren Verbrauch erkauft (rechts). Quelle: Debbie Marr Eine bessere Fertigung ermöglicht tendenziell mehr Leistung bei weniger Verbrauch (links). Bei einer besseren Architektur wird das Performance-Plus hingegen durch einen höheren Verbrauch erkauft (rechts). Prozessoren können sich durch Taktänderungen auf der durch den Prozess und die Architektur vorgegebenen Leistungs-/Verbrauchskurve bewegen. Quelle: Debbie Marr Prozessoren können sich durch Taktänderungen auf der durch den Prozess und die Architektur vorgegebenen Leistungs-/Verbrauchskurve bewegen.

Ebenso interessant: CPUs mit Core Ultra 400: Konkretere Hinweise zu Intels X3D-Konkurrenz

Eine größer gedachte Lösung, um die Hitzeentwicklung in den Griff zu bekommen, ist laut Marr die Aufteilung in P- und E-Kerne. P-Kerne setzen auf hohe Leistung und ein entsprechendes Temperaturmanagement, E-Kerne dienen hingegen als effiziente und platzsparende Erweiterung für Multicore-Aufgaben. Das soll gut zur Realität passen: Angeblich laufen die meisten Anwendungen nur auf einem (P-)Kern. Am zweithäufigsten kommen hingegen Anwendungen, die alle Kerne belasten. Dann kommen die vielen E-Kerne zum Tragen.

Die meisten Anwendungen nutzen angeblich nur einen oder alle CPU-Kerne. Quelle: Debbie Marr Die meisten Anwendungen nutzen angeblich nur einen oder alle CPU-Kerne. Gleichzeitig sieht Marr eine stärkere Zusammenarbeit der Entwicklungsabteilungen als Lösungsweg an. Nur wenn die Architektur, die Fertigung und das Packaging aufeinander abgestimmt sind, kann es demnach gelingen, das Wärmeproblem möglichst effektiv anzugehen. Und das sorgt wiederum dafür, dass Endkunden möglichst schnelle Prozessoren kaufen können.

Halten Sie Intels Konzept für gelungen? Nutzen Sie die Kommentarfunktion und teilen Sie uns Ihre Meinung mit. Zum Kommentieren müssten Sie auf PCGH.de oder im Extreme-Forum eingeloggt sein. Sollten Sie noch keinen Account haben, könnten Sie über eine Registrierung nachdenken, die viele Vorteile mit sich bringt. Beachten Sie beim Kommentieren aber bitte die gültigen Forenregeln.

Quelle: Debbie Marr (Ahead Computing, IEDM 2025)

9
    • Kommentare (9)

      Zur Diskussion im Forum
      • Von Logos_Atum Komplett-PC-Aufrüster(in)
        Ich denke da gibt es noch viele Stellschrauben. Ich hab mir damals nen 12900Kf geholt, wohlwissend das man mit vielen Stellschrauben wirbt, die man als Nutzer dann nie erreichen wird. Die Zeit in denen die Hersteller FTP - Seiten die Lösung waren sind vorbei. Wenn ich mir allein ansehe das man die Turbogruppen aus direkt nebeneinander liegenden Kernen erstellt, ist das ganz einfach unfassbar dumm.

        Ich hab mal einen Die- Shot Photogeshoppt um zu zeigen wie eine 4- Core Group aussehen MUSS. Warum legt man hoch taktende Kerne im Standard direkt nebeneinander?! Das spricht doch so vieles dagegen. Interferenzen, Hitze etc.. Ich glaube kaum das man langsamer Unterwegs ist weil die Leiterbahnlänge nach oben geht. So ist ein inaktiver oder niedrig taktender Kern der Nachbar und keiner der gerade zieht was geht.

        Bei den E- Core Clustern könnte man konsequenterweise auch so vorgehen. Simples Checkerboard.´Und man kommt ja auf die "kühlen" Kerne wenn man die bei Vollast monitored, so kann man das auch noch in Betracht ziehen.

        Macht das so wenn ihr einen Prozessor der Serie habt- das funkt richtig gut. Und es wäre wohl kaum ein Problem das zu patchen. Zumindest im groben. Ist die Latenz gut genug und man rennt nicht in einen Waitstate, kann man das doch im Wechsel machen, vielleicht sogar mit Temp Tresholds für die Kerne. So werden die tatsächlich gleichmäßig belastet.

        Ah und zu "welcher Kern für welchen Task". Ich suche lange nach einem Tool mit dem man das permanent zuordnen kann.

        Vielleicht ginge der Spaß so auch verloren.

        P.S.: Kern drei- warum 7 Grad mehr als der Rest XD

        [Ins Forum, um diesen Inhalt zu sehen]
      • Von Logos_Atum Komplett-PC-Aufrüster(in)
        Ich denke da gibt es noch viele Stellschrauben. Ich hab mir damals nen 12900Kf geholt, wohlwissend das man mit vielen Stellschrauben wirbt, die man als Nutzer dann nie erreichen wird. Die Zeit in denen die Hersteller FTP - Seiten die Lösung waren sind vorbei. Wenn ich mir allein ansehe das man die Turbogruppen aus direkt nebeneinander liegenden Kernen erstellt, ist das ganz einfach unfassbar dumm.

        Ich hab mal einen Die- Shot Photogeshoppt um zu zeigen wie eine 4- Core Group aussehen MUSS. Warum legt man hoch taktende Kerne im Standard direkt nebeneinander?! Das spricht doch so vieles dagegen. Interferenzen, Hitze etc.. Ich glaube kaum das man langsamer Unterwegs ist weil die Leiterbahnlänge nach oben geht. So ist ein inaktiver oder niedrig taktender Kern der Nachbar und keiner der gerade zieht was geht.

        Bei den E- Core Clustern könnte man konsequenterweise auch so vorgehen. Simples Checkerboard.´Und man kommt ja auf die "kühlen" Kerne wenn man die bei Vollast monitored, so kann man das auch noch in Betracht ziehen.

        Macht das so wenn ihr einen Prozessor der Serie habt- das funkt richtig gut. Und es wäre wohl kaum ein Problem das zu patchen. Zumindest im groben. Ist die Latenz gut genug und man rennt nicht in einen Waitstate, kann man das doch im Wechsel machen, vielleicht sogar mit Temp Tresholds für die Kerne. So werden die tatsächlich gleichmäßig belastet.

        Ah und zu "welcher Kern für welchen Task". Ich suche lange nach einem Tool mit dem man das permanent zuordnen kann.

        Vielleicht ginge der Spaß so auch verloren.

        P.S.: Kern drei- warum 7 Grad mehr als der Rest XD

        [Ins Forum, um diesen Inhalt zu sehen]
      • Von _noid_ PC-Selbstbauer(in)
        Temperatur ist das Problem an dem Intel mit der 13ten und 14ten Generation schließlich an seine Grenzen gekommen ist bzw überschritten hat, wenn man an das Microcode Update Problem denkt. Kein noch so ausgeklügeltes Design von ihnen konnte kompensieren, dass die 10nm Node am Ende war.

        Jetzt mit Intels TSMC N3B Chips (Core 9 285K z.B.) werden die plötzlich mit AMDs Prozessoren im Effizienz-Index vergleichbar. Thermisch ist der Unterschied im realen Betrieb selbstverständlich geringer - was nützt denn die kühlere CPU, man reizt das Potential dennoch aus.
      • Von Horst_Koehler Software-Overclocker(in)
        Das Thema hat unser geliebter [Ins Forum, um diesen Inhalt zu sehen] doch auch schon einmal in einem Video mit einem Ingenieur behandelt:
        [Ins Forum, um diesen Inhalt zu sehen]

        Geiles Video btw ! Leider ist die Zeit wohl mittlerweile viel zu knapp für solche Videos geworden.
      • Von tokenrider Freizeitschrauber(in)
        Zitat von saphira33
        Du könntest das Problem umgehen mit einer Thunderbot PCIe Karte für ein AMD System.
        Ein separater Thunderbolt-Controller hängt bei AMD nicht direkt am CPU-I/O, sondern hinter zusätzlicher PCIe-Logik. Stabilität und Verhalten hängen stärker von Board-BIOS, Controller-Firmware und Treibern ab, wodurch Audio-Interfaces nicht immer so konsistent laufen wie an nativ integrierten Intel-TB-Hosts.
        Für professionelles Recording mag das kein KO-Kriterium sein, aber native Thunderbolt-Implementierungen sind m.E. robuster, homogener und berechenbarer.
        Zitat von saphira33
        Die Interconnect Latenzen von CPU Dies sind um Faktoren 1000x oder mehr kleiner als deine Latenz zwischen einzelnen aufgenommenen Frames. Daher sollte das nicht ins gewicht Fallen.
        Ja, das mag sein.
        Zitat von saphira33
        Aber auch bei Intel sollte das kein Problem sein. Moderne Aufnahmesoftware lässt den Codec ja auch über die GPU laufen für die RealTime komprimierung. Da dürfte die Latenz massgeblich grösser sein aus auf einer CPU.
        Vielleicht im Videobereich, aber im Recordingbereich wird immer noch mit PCM gearbeitet, da geht nichts über die GPU.
      • Von saphira33 Software-Overclocker(in)
        Zitat von tokenrider
        Irgendwie wird es scheinbar immer schwieriger mit der Plattformwahl. Kaum noch PCIe Sockel. Wenn man Thunderbolt haben möchte, verkompliziert sich das Ganze beliebig, bei AMD eher weniger vertreten.
        Du könntest das Problem umgehen mit einer Thunderbot PCIe Karte für ein AMD System.
        Die Interconnect Latenzen von CPU Dies sind um Faktoren 1000x oder mehr kleiner als deine Latenz zwischen einzelnen aufgenommenen Frames. Daher sollte das nicht ins gewicht Fallen.
        Aber auch bei Intel sollte das kein Problem sein. Moderne Aufnahmesoftware lässt den Codec ja auch über die GPU laufen für die RealTime komprimierung. Da dürfte die Latenz massgeblich grösser sein aus auf einer CPU.
      Direkt zum Diskussionsende
  • Print / Abo
    Apps
    PCGH Magazin 07/2026 PC Games 06/2026 play5 07/2026 N-Zone 06/2026 Linux Magazin 06/2026 LinuxUser 06/2026 Raspberry Pi Geek 07/2026
    PC Games Hardware PC Games Linux Magazin Raspberry Pi Geek Computec Kiosk