Intel Denverton: Atom-CPUs mit bis zu 16 Goldmont-Kernen
Es gibt neue Informationen zu Intels Einsteiger-Server-Plattform Denverton. Laut der Datenbank von Sisoftware Sandra wurde eines der Topmodelle, der Atom C3955 mit 16 Goldmont-Kernen, validiert. Intel hat laut der offiziellen Ark den Einsteiger-Atom C3338 mit zwei Kernen veröffentlicht. Auf dem Markt erhältlich ist allerdings noch nichts.
Im Endkundenbereich hat Intel die Marke Atom unlängst aufgegeben und bietet seine Low-End-Architektur mit Codenamen Apollo Lake nur noch als Celeron sowie Pentium in Tablets und günstigen Notebooks an. Asus war der letzte große Abnehmer für Smartphone-Chips von Intel, setzt inzwischen aber auch auf Qualcomm-SoCs. Im Serverumfeld darf Atom noch etwas länger leben und das Angebot unterhalb von Xeon D (Broadwell-D) ergänzen.
Nach Avoton aus dem Jahre 2013, der bis zu acht Silvermont-Kerne im 22-nm-Prozess nutzt, steht die nächste Evolutionsstufe Denverton an. Ursprünglich sollte die schon im Jahre 2014 erscheinen, wurde aber immer wieder verschoben. Inzwischen soll Denverton nicht mehr nur auf dem Silvermont-Shrink Airmont (14 nm, "Cherry Trail" im Endkundenbereich) basieren, sondern die verbesserten Goldmont-Kerne, ebenfalls in 14 nm, nutzen. Entsprechende Endkunden-Celerons und -Pentiums firmieren unter dem Namen Apollo Lake.
Intel selbst gibt in seiner Ark-Datenbank an, dass der C3338 als erstes Denverton-SoC bereits veröffentlicht worden sei. Öffentlich erhältlich ist er bis jetzt nirgendwo. Zwei Kerne dürfen sich 4 MiByte L2-Cache teilen und kommen bei einem CPU-Takt von 1,5/2,2 GHz (Basis/Turbo) mit einer TDP von 9 Watt aus. Der große L2-Cache deutet darauf hin, dass Rechenkerne deaktiviert wurden, während der Zwischenpuffer zu größeren Teilen aktiv blieb. Avoton nutzte noch 512 KiByte L2-Cache pro Kern.
Die Webseite servethehome.com hat einen Eintrag auf der Datenbank der Benchmark-Software Sisoftware Sandra entdeckt, bei dem ein C3955 auf einer Supermicro-Plattform getestet worden sein soll. Genannt werden 16 Rechenkerne mit einem maximalen Takt von 2,1 GHz und 16 MiByte L2-Cache. Dabei dürfte es sich um den Vollausbau handeln, was sich mit früheren Aussagen von anandtech.com deckt. Die Goldmont-Kerne in Denverton bekämen doppelt so viel L2-Cache spendiert wie jene in Apollo Lake. Abgesehen vom Ark-Eintrag hält sich Intel noch komplett bedeckt - irgendeine Form einer Pressemitteilung verschickte der Chiphersteller bisher nicht.

NAS
Multicore-Berechnungen (kann ich gut gebrauchen für meine Tools).
(Eine Antwort nur für Shootme55)
NEIN.
Es gibt Dinge (eigentlich: fast alles), die nicht parallelisierbar sind. Auch nach vieler Optimierung nicht. Man verliert mit jeder weiteren Parallelisierung an Effizienz. Amdahl lässt grüßen.
Gut parallelisierbar sind kleine, immergleiche Aufgaben (etwa Rendering). Schlecht bis kaum parallelisierbar sind alle Aufgaben die sich stetig ändern. Also eigentlich jedes Spiel mit interaktiven Elementen.
Auch unterschiedliche Aufgaben parallelisieren ist schwierig: Physik alleine lässt sich vergleichsweise einfach parallelisieren. Den Physik-Thread (bzw die Threads) kann man dann aber nur wieder mit großem Aufwand mit dem "Spielewelt"-Thread syncronisieren. Weil diese nunmal unterschiedlich schnell laufen, je nach Spielsituation. Ganz zu schweigen von Sound, Netzwerk, KI, Drawcalls...
An many core-architekturen und inversem Multithreading wird seit Jahren geforscht. Prozessoren die 1000 minikerne haben und jeden Thread zerlegen und berechnen usw usf. Effizient ist das bislang nicht. Es gibt zwar einige interessante Prozessoren in dieser Richtung (C't hat diesbezüglich einmal berichtet), aber ob dies der richtige Weg ist, ist fraglich. Und diese Prozessoren haben dann mit unserer heute bekannten Multcore-Architektur nix zu tun.
Grafikkarten sind nach wie vor Spezialprozessoren. Deren 4000 Kerne lassen sich nur deshalb ausnutzen, weil sich diese winzigen, einfachen Aufgaben eben hervorragend parallelisieren lassen. Das trifft aber auf 99% der anderen Dinge nicht zu. Sonst würde AMD längst Radeon Desktopprozessoren verkaufen die x86 emulieren. Per software geht das ganze schon längst, Transmeta hatte einen VLIW-Prozessor, welcher teils ähnlich wie eine Grafikkarte funktioniert hat und x86 Code ausgeführt hat.
Gesendet von meinem SM-G900F mit Tapatalk
NEIN.
Es gibt Dinge (eigentlich: fast alles), die nicht parallelisierbar sind. Auch nach vieler Optimierung nicht. Man verliert mit jeder weiteren Parallelisierung an Effizienz. Amdahl lässt grüßen.
Gut parallelisierbar sind kleine, immergleiche Aufgaben (etwa Rendering). Schlecht bis kaum parallelisierbar sind alle Aufgaben die sich stetig ändern. Also eigentlich jedes Spiel mit interaktiven Elementen.
Auch unterschiedliche Aufgaben parallelisieren ist schwierig: Physik alleine lässt sich vergleichsweise einfach parallelisieren. Den Physik-Thread (bzw die Threads) kann man dann aber nur wieder mit großem Aufwand mit dem "Spielewelt"-Thread syncronisieren. Weil diese nunmal unterschiedlich schnell laufen, je nach Spielsituation. Ganz zu schweigen von Sound, Netzwerk, KI, Drawcalls...
An many core-architekturen und inversem Multithreading wird seit Jahren geforscht. Prozessoren die 1000 minikerne haben und jeden Thread zerlegen und berechnen usw usf. Effizient ist das bislang nicht. Es gibt zwar einige interessante Prozessoren in dieser Richtung (C't hat diesbezüglich einmal berichtet), aber ob dies der richtige Weg ist, ist fraglich. Und diese Prozessoren haben dann mit unserer heute bekannten Multcore-Architektur nix zu tun.
Ich sehe eine Zukunft vor mir in dem alles nur noch von Grafikkarten berechnet wird