Zen 5: AMD-Patent für Hybrid-Prozessoren behandelt Taskwechsel
Aktuell macht ein AMD-Patent vom Ende 2019 die Runde, das Hybrid-Prozessoren behandelt; genauer die Prozesse, die den Taskwechseln zwischen großen und kleinen Prozessoren zugrundeliegend.
Hybrid-Prozessoren nach dem Big-Little-Prinzip werden wohl auch im x86-Bereich eine wichtige Rolle einnehmen. Intel hat mit Alder Lake seine Technik bereits recht nah an der Marktreife; bei AMD wird die Umsetzung erst mit Zen 5 erwartet (Zen 4 soll kommendes Jahr erscheinen). Bei AMD scheint man aber schon geraume Zeit an der Technik zu forschen, wie ein nun aufgetauchtes Patent nahelegt, das bereits im Dezember 2019 beantragt wurde.
Dabei geht es unter anderem um einen der wichtigsten Aspekte des Ansatzes mit großen und kleinen Prozessoren: Wie verschiebt man optimal die Threads zwischen den Kernen von heterogenen Prozessoren? Auf Prozessorebene wird das laut dem Patentantrag von AMD auf Basis von mehreren Faktoren entschieden, etwa der Ausführungszeit oder bei der Anforderungen auf Speicherzugriffe. Neben der CPU wird aber auch der Scheduler des Betriebssystems gefragt sein, weshalb man annimmt, dass Alder Lake im Herbst nicht ohne das Windows-10-Update starten kann.
Erstmals in einem Endkundenprodukt in Aktion sehen wird man die Technik wohl in Ryzen 8000, Codename Strix Point - bei AMD als APU einzustufen. Das ist basierend auf der Annahme, dass Zen 3 noch einen Refresh bekommt, ebenso wie Zen 4. Mit den heterogenen Prozessoren ab Zen 5 wird die Technik aber dann voraussichtlich auch weniger linear sein, wie man das bisher kennt. Ryzen 8000 soll aus Zen-5-Kernen und Zen4D-Kernen bestehen, letztere sind die kleineren und langsameren, aber auch weniger energiehungrigen Einheiten. Granite Ridge, Mainstream-Desktop-CPU, soll die Technik derweil noch nicht haben. Bis dahin wird vermutet, dass Intel schon mit Raptor Lake auf dem Markt ist.
Quelle: Freepatents, via Kepler_L2 (Twitter)

Mir ist auch völlig egal ob die CPU 50 Watt mehr oder weniger benötigt bei Teillast. Big Little kann gerne in Notebooks usw. kommen, aber Bitte nicht im Gaming PC.
Angesichts der Tatsache, dass der 5800X sich mit seinem nur einem CCD jedoch verbrauchstechnisch deutlich anders verhält in einem mittleren Lastszenario wie Gaming, wäre es natürlich schön, wenn noch ein Update folgen würde. Blöderweise würde ich dann aber auch hier weiterführend darauf hinweisen wollen, dass zwischen RKL und CML als 11700K und 10700K ebenso durchaus beträchtliche Unterschiede zu erwarten sind, die sich absehbar im Verbrauch deutlich niderschlagen werden ... ich weiß ... das ist die Geschichte mit dem kleinen Finger und dem ganzen Arm.
Ergänzend, weil ich es gerade unten sehe: Den Header "Ist 7nm nun effizienter als 14nm?" würde ich umformulieren, denn der erscheint mir bestenfalls provokant aber nicht sachlich korrekt gewählt, denn die Frage stellt sich gar nicht, da TSMCs N7 grundsätzlich effizientere Designs ermöglicht als Intels 10nm+++ alias P1272.
Der Autor stellt hier ja auch keinen Prozess- sondern einen CPU-Vergleich an und hierbei ist der Prozess nur ein Teil des Gesamtbildes (bei AMD gleich umso mehr, da nicht einmal die ganze CPU im N7 gefertigt wird). Der Absatz erscheint mir inhaltlich ok, den Titel finde ich unnötig provokant bzw. in die Irre leitend, aber vielleicht wurde der ja auch absichtlich in der Art gewählt, um den geneigten Leser auch noch den letzten Absatz durchlesen zu lassen.
Einzig das "Fazit" im letzten Absatz erscheint unvollständig, aber da der Blogeintrag bisher keine Daten zu dem sich deutlich abweichend verhaltenden R7 5800X liefert, erscheint das hinnehmbar. Abgerundeter wäre es dennoch, wenn man einen Vorausblick auf diesen geben würde und zumindest schon einmal grob skizzieren würde, dass sich das Bild hier absehbar ändern wird.
Ergänzend zu obigem "Effizienzprinzip": Die letztgenannte Überlegung muss nicht nur für externe Prozesse gelten sondern kann auch auf Threads innerhablb einer Game-Engine übertragen werden. Physik und KI nehmen bspw. einen deutlich kleineren Anteil an der Gesamtrechenzeit/last eines Frames in Anspruch, d. h. wenn man hier zusätzliche Kerne hat, ist es natürlich von Vorteil, wenn man diese Threads gar komplett auslagern kann auf bspw. einen kleinen, effizienten, langsameren Kern. Die Überlegung einen komplett eigenständigen Kern für derartige Threads zu beanspruchen, kann natürlich auch auf FullSize-Kern-CPUs mit vielen Kernen übertragen werden, nur absehbar werden die kleinen Kerne hier diesen Workload effizienter berechnen, während auf ersterer CPU ein weiterer großer Kern veranschlagt wird, der dann nicht den Ruhemodus geschickt werden kann und die erzielten Einsparungen auf dem big.LITTLE-Design kommt am Ende der gesamten CPU zugute, entweder weil man sparen will oder weil man die freien Energieressourcen für mehr Takt verwenden kann.
Am Ende ist hier vieles Denkar, hier wird man abwarten müssen wie sich das über die Zeit entwickelt, aber ganz offensichtlich handelt es sich bei der Technologie um kein Experiement oder eine Art Eintagsfliege, wie von manchen suggeriert (oder erhofft?).