Intel Silizium-Photonik: RISC-CPU mit acht Prozessorkernen und 528 Threads für militärische Forschungsprojekte
Im Rahmen des Branchenkongresses Hot Chips 2023 hat Intel das Design einer RISC-CPU demonstriert, welche über acht Prozessorkerne jeweils 66 Threads und somit insgesamt 528 Threads verarbeiten kann. Die einzigartige CPU soll für spezifischen Arbeitslasten mit einem hohen Bedarf an Parallelisierung, wie dem HIVE-Programm der DARPA, ein äußerst rechenintensiver Graph-Analyse-Workload, zum Einsatz gebracht werden.
Im Rahmen des Branchenkongresses Hot Chips 2023 hat Intel das Design einer CPU auf Basis der RISC-Architektur demonstriert, welche über acht Prozessorkerne jeweils 66 Threads und so insgesamt 528 Threads verarbeiten kann. Die einzigartige CPU soll für ganz spezifische Arbeitslasten mit hohem Bedarf an Parallelisierung, wie z.B. dem HIVE-Programm der DARPA ("Defense Advanced Research Projects Agency"), einem äußerst rechenintensiven Graph-Analyse-Workload, zum Einsatz gebracht werden.
Intel demonstriert RISC-Prozessor mit Silizium-Photonik
Für diesen und ähnliche Workloads hat Intel die "RISC-CPU with Silicon Photonics", einen RISC-Prozessor mit Silizium-Photonik, entwickelt, wie die Webseite servethehome.com jetzt berichtet hat.
Quelle: Intel via servethehome.com
Intels RISC-Prozessor mit Silizium-Photonik bietet 8 Kerne und 528 Threads
Die Eckdaten lesen sich beeindruckend: 8 Prozessorkerne mit jeweils 66 Threads und 528 Threads insgesamt sowie 192 KiByte Cache je RISC-Prozessorkern und 4 MiByte SRAM. Der Prozessor basiert auf der RISC-Architektur und nicht auf x86, nutzt aber Silizium-Photonik für die Vernetzung. Der RISC-Prozessor wird in einem Design geliefert, welches einem Chipsatz sehr ähnlich ist, um die optischen Chips miteinander und mit dem Haupt-CPU-Die zu verbinden.
16 Multi-Threaded Pipelines und DDR5-4400
Bei näherer Betrachtung verfügt die CPU über 16 Multi-Threaded Pipelines ("MTP"), während die Single-Threaded Pipelines ("STP") eine 8-fach höhere Single-Threaded-Leistung bieten sollen. Die Architektur basiert, wie bereits erwähnt, auf einem kundenspezifischen RISC-Design mit 32 Registern pro Thread. Der interne Speichercontroller ("IMC") unterstützt bis zu DDR5 mit 4.400 MT/s.
Quelle: Intel via servethehome.com
Intel Direct Mesh to Mesh Optical Fabric
Intel demonstriert erstmals eine optische Mesh-to-Mesh-Optical-Fabric, die bezogen auf das HIVE-Programm der DARPA, eine Behörde des Verteidigungsministeriums der Vereinigten Staaten, die Forschungsprojekte für die Streitkräfte der Vereinigten Staaten durchführt, eine 1.000x höhere Leistung pro Watt bieten können.
Der RISC-Prozessor mit 1,2 Milliarden Transistoren pro CPU-Kern und 27,6 Milliarden Transistoren insgesamt wird in 7 nm bei TSMC gefertigt und ist für den Sockel BGA-3275 mit 3.275 Kontakten vorgesehen.
3,35 bis 3,5 GHz bei 35 bis 55 Watt
Eine von Intel im Rahmen der Hot Chips 2023 gezeigte Demo gibt Aufschluss über die Leistung und die Taktfrequenz ("Fmax") der mit einer TDP von 75 Watt spezifizierten RISC-CPU. Bei einer Taktfrequenz von 3,35 bis 3,5 GHz nimmt die CPU zwischen 35 und 55 Watt an Leistung auf, wobei ein Großteil der Leistung für die Photonik aufgewendet wird. Die RISC-Kerne sind vergleichsweise sparsam.
Ihre Meinung ist gefragt!
Wie stehen Sie zu diesem Thema? Die PCGH-Redaktion freut sich über Ihre fundierte Meinung in den Kommentaren zu dieser Meldung. Um zu kommentieren, müssen Sie auf PCGH.de oder im Extreme-Forum eingeloggt sein. Sollten Sie noch keinen Account haben, könnten Sie sich hier unverbindlich registrieren.
Quelle: Intel via servethehome.com

Und bis auf die Xbox 1 waren alle Konsolen speziel.
...
Aber wie gesagt, ich halte es schon für insgesamt sinnvoller, wenn es denn geht, einen Aufgabentyp einer entsprechenden Einheit zuzuordnen und bin deswegen froh, dass diese Zwischenstufe sich nicht durchgesetzt hat, sondern GPUs entsprechend besser wurden, dass sie nicht mehr nötig ist.
Ich habe gelesen, dass ursprünglich geplant war, einen zweiten Cell-Prozessor für die Grafik zu nutzen. Im Endeffekt kann man sich den Cell-Prozessor wohl vorstellen wie einen Einkerner mit mehreren Vektoreinheiten. Das kommt einer CPU/GPU-Kombination schon recht nahe. Ich muss dabei ein bisschen an Intels Larrabee denken.
Ja, beide basieren auf dem PowerPC. Der Cell halt mit einem Kern und den Vektoreinheiten, der Xenos mit drei Kernen. Und ja, für die Entwickler ist die letztere Kombination mit klar getrennter CPU und GPU einfacher. In Endeffekt musste man auf der PS3 CPU, SPUs und GPU ausbalancieren, während man auf der XBox nur CPU und GPU hatte.
Ja, sieht man in den Videos ja. Einzelne Aufgaben wurden dann auf die SPUs geschoben. Wusste ich auch nicht. So kann man natürlich die GPU entlasten, durchgesetzt hat es sich meiner Meinung nach aber zurecht nicht. Was die Physik angeht, konnte die GPU vermutlich gar nicht helfen, die basierte nämlich auf der Geforce 7, die noch überhaupt keine GPGPU-Anwandlungen hatte. Das kam ja alles später. Eine dritte Ressource für solche Extras zu haben, ist ja im Endeffekt mit den Physik-PUs auch noch mal gescheitert und die deutlich flexibleren GPUs haben das Ende der Idee dann wohl besiegelt.
Irgendwie war jede PS vor der PS4 auf ihre Art speziell, die PS1 hatte wohl keine Gleitkommaeinheiten und keinen Z-Puffer. Ersteres führt zu diesem typischen "Gewobbel", zweiteres dazu, dass sich manche Polygone in Bewegung nicht so recht entscheiden können, ob sie weiter vorne oder hinten sind, was auch zu einem "instabilen" Look beitrug. Man könnte fast meinen, Sony hätte eine leicht sadistische Ader gegenüber den Entwicklern gehabt.
Aufjedenfall waren die Konsolen Generationen damals interessanter bzw spannender.
Und bis auf die Xbox 1 waren alle Konsolen speziel.
Die CPU der 360 IBM Power PC RISC Prozessor konnte wie der Cell nur In Order.
Der gemeinsame Speicher der 360 512mb hat ihr sehr geholfen genau wie der EDRam in der GPU.
Die PS3 hatte das Problem das der Cell nur auf seine 256MB und die GPU nur auf Ihre 256 Mb zugreifen konnte.
Schatten und globale Beleuchtung + anderes zeug wurde daher auf den SPU´s berechnet, was laut den Entwicklern deutlich flotter ging als auf de betakten 79xxGTx.
Im Grunde sehen wir es bis heute, technik ist das eine aber am Ende entscheidet das Ergebnis.
Die SPU´s wurden dann für Physik rangeholt und auch so geile Effekte wie der Schnee oder Wasser und das die Hose nas wurde und Trocknete machte alles die SPU´s nebenbei.
In Kill Zone 2 ist z.B die Sicht etwas eingeschränkt, schätze ca 60%, dazu sind viele Assets recycled um Ram zu sparen, sowie die immer gleichen Gegner, was uncharted auch genutzt hatte. Die haben getricks wo es nur ging, Uncharted konnte man nie nah an die Texturen gehen, vom weiten sah alles mega aus.
Quelle: https://www.eurogamer.net...
Zitat:
Unbelievably, considering that the original Uncharted is still such a beautiful-looking game, almost all of its visual effects were achieved using the RSX graphics chip pretty much in isolation. For Uncharted 2 - and indeed many recent games - Cell is used as a parallel graphics processor working in tandem with the RSX. Tasks traditionally associated with the GPU are passed off to the Cell's SPUs.
What this means in basic terms is more time for the RSX to do its thing while the Cell takes care of the vast majority of Uncharted 2's excellent post-processing effects. Screen space ambient occlusion (SSAO), for example, was all done completely on the Cell.
"The SPUs gave us an increase in the quality of our bloom effects," Lemarchand adds. "Depth of field, which was kind of a hack in the first Uncharted, was a much more physically correct solution in Uncharted 2, which made the times that we used it in the service of cinematography that much more powerful as a story-telling tool.
"We also implemented a filmic HDR response curve and Uncharted 2 has a much wider range of colours between light and dark than its predecessor making it look much more like the game was shot on film, supporting our goal of making a cinematic reality."
Der Nvidia Chipo allein war zu schwach und der Speicher 2 *256MB konnte nicht zusammen genutzt werden.
Waren das wirklich die SPUs? Die PS3 hatte doch eine extra Grafikeinheit auf Basis der Geforce 7. Der Cell war doch schon nur der Prozessor und der hat doch die Entwickler vor das Problem gestellt, dass die Single-Thread-Performance nicht sonderlich hoch, die CPU dafür aber unheimlich viel theoretische, parallele Leistung hatte, die es irgendwie zu nutzen galt, also eigentlich schon viel zu parallel war.
Der Cell basiert auf dem IBM Power PC Prozessor, MS hat sich Entschieden drei der PPU´s mit SMT zu verbauen, was am Ende für Entwickler einfacher war.
Später wurden die Engines umgebaut, die Grafik wurde teilweise vom Cell also den Spu´s berechnet, sowie Physik etc.
Der Nvidia Chipo allein war zu schwach und der Speicher 2 *256MB konnte nicht zusammen genutzt werden.
Daher galt die PS3 als sehr komplex in der Programmierung .
In dem Video wird ganz gut von Naughty Dog beschrieben was die Hardware Limits waren und wie man die umgangen hat:
[Ins Forum, um diesen Inhalt zu sehen]
Ich erinnere mich das Guerilla Games das in Killzone 2 nutzen, dort waren 24 Threads die die SPU´s in Echtzeit easy berechnen konnten.
[Ins Forum, um diesen Inhalt zu sehen]
Super interessant.
Eine Sonderstellung nimmt das BGA (Ball Grid Array) ein, dessen halbkugelförmige Kontakte aus [Ins Forum, um diesen Inhalt zu sehen] bestehen und in der Produktion ausschließlich verlötet werden.
Also ist es auch ein Sockel ?!
Aber in der Elektroindustrie würde die Bezeichnung "Sockel" für die Lotbällchen zu Missverständnissen führen. Ein Sockel ist normalerweise eine Fassung. Und beim BGA ist die CPU nicht eingefasst.
[Ins Forum, um diesen Inhalt zu sehen]
Intel wird in einer generischen Tabelle, in der es ein Feld: "Sockel", gibt, sicherlich "Sockel: BGA-XXX" schreiben. Das kann dann zu derartigen Missverständnissen führen, und wenn man die Angabe "Socket" nur als logischen Begriff betrachtet, wäre er ja auch nicht falsch, weil er die Anbindung von der Seite der CPU aus betrachtet und nicht von der Seite aus, was auf dem Mainboard ist.