Startup will mit 4.096 Kernen den effizientesten Mikroprozessor anbieten

News 24.03.2012 um 18:10 Uhr Norman Wittkopf Als bevorzugte Quelle auf Google hinzufügen

Die Firma Adapteva möchte mit ihrem Prozessor-Modell 4.096 Kerne auf einem Chip vereinen und bei 80 Watt Leistungsaufnahme 5,632 TFlops liefern. Dies ist jedoch momentan noch reine Theorie und nur als Simulation vorhanden. Ein erster 16-Kerner sei hingegen schon lauffähig.

Das US-amerikanische Startup-Unternehmen Adapteva plant mit ihrem Epiphany E4K benannten Prozessor die bisher effizienteste CPU anzubieten. Der von Globalfoundries in 28 Nanometer gefertigte Chip soll als E4KG4 im Vollausbau mit 4.096 Rechenkernen bei 600 MHz und 80 Watt Leistungsaufnahme 5,632 TFlops an Rechenleistung erreichen - oder anders ausgedrückt etwa 70 GFlops pro Watt. Dies wäre effizienter als bisherige CPU- oder GPU-Produkte bekannter Hersteller. Auch die Chipfläche mit über 524 Quadratmillimetern Größe, wäre überdurchschnittlich hoch, aber durchaus bereits erreicht.

Bisher kann das Unternehmen nach eigenen Angaben aber lediglich einen in 65 Nanometer gefertigten Prozessor mit 16 Kernen vorweisen, auf dem die Leistungswerte des theoretischen Vollausbaus wohl auch beruhen. Die Architektur verknüpft viele RISC-Prozessorkerne, denen jeweils ein Cache von 32 KByte SRAM zur Verfügung steht. Die Leistungswerte sollen außerdem durch ein Kommunikationsnetzwerk mit geringen Latenzen erreicht werden, was durch Taktgeber und Caches gewährleistet sein soll. Ähnlich dem Geschäftsmodell von ARM strebt auch Adapteva ausschließlich eine Lizenzierung der Technologie an, ohne selbst zu produzieren oder zu verkaufen.

Quelle: golem.de, adapteva.com

Reklame: Verpassen Sie nicht den stets aktuellen PCGH-Schnäppchenführer mit Tiefpreis-Tipps für DVD, Blu-ray und Spiele.

Artikel teilen

Per E-Mail versenden

- Kommentare (21)
  Zur Diskussion im Forum
  
  Von GoldenMic Kokü-Junkie (m/w)
  
  16 Kerne in 65 nm...und das rechnet man dann hoch auf 4096 Kerne? Das finde ich etwas zu krass. Ich kann mir nicht vorstellen das man wirklich dort landet, wenn doch dann wäre es wirklich erstaunlich.
  
  Zitieren
  
  Von GoldenMic Kokü-Junkie (m/w)
  
  16 Kerne in 65 nm...und das rechnet man dann hoch auf 4096 Kerne? Das finde ich etwas zu krass. Ich kann mir nicht vorstellen das man wirklich dort landet, wenn doch dann wäre es wirklich erstaunlich.
  
  Zitieren
  
  Von ruyven_macaran Trockeneisprofi (m/w)
  
  Zitat von X-CosmicBlue
  
  Ich weiß, Google ist Dein Freund, wenn es um solche Sachen geht, aber wenn man solche Angaben macht, warum nicht kurz ein Vergleich zu aktuellen, gängigen CPUs?
  
  Weil es irreführend wäre, die abstrakte Spitzenleistung von komplett verschiedenen Chips zu vergleichen. Die Zahlen würde eine Überlegenheit suggerieren, die aufgrund massiver Unterschiede in der Auslastungseffizienz rein gar nichts mit der Praxis zu tun hätte, von der Problematik verschiedener Befehlssätze und somit ggf. Unfähigkeit, überhaupt gleiche Probleme zu bearbeiten, ganz zu schweigen.
  In deinem Beispiel kommen sogar noch himmelweite Unterschiede beim Funktionsumfang hinzu.
  
  Zitat von Killer Mandarine
  
  "Nicht jedes" ist ein bisschen beschönigend formuliert. "Kaum ein" wäre treffender.
  
  Ich biete "gar keins". Was aber ggf. noch nicht einmal ein großes Problem wäre (virtualisierung 100ter Systeme würde z.B. genug unabhängige Aufgaben liefern), wenn wenigstens die Leistung der einzelnen Kerne hinhauen würde. Hier hab ich aber schon bei der Anbindung massive Zweifel.
  
  Zitat von Locuza
  
  Wie hoch ist die IPC? Hat das Ding überhaupt genug Caches für XYZ?
  
  128 MiB SRAM klingen eher danach, als würden sich Probleme mit der Fertigung denn mit der Cachegröße ergeben
  Aber -s.o.- man sollte halt Einzelprobleme haben, die weder Cache noch Rechenleistung benötigen...
  
  Zitieren
  
  Von Goliath1985 Komplett-PC-Käufer(in)
  
  Wie uns schon das VLW5 Design von den ATI Karten zeigte , sind die Prozessoren nur so effizient , wenn sie auch so ausgelastet werden. Hier kommt ja auch noch das Amdalsche Gesetz hinzu, das kurz und knapp schildert, das je mehr Kerne desto mehr Verwaltung und das macht die Kurve der Effizienz kaputt ! Amdahlsches Gesetz
  
  Klar alles Theorie , naja lassen wir uns mal überaschen.
  
  Grüße Goliath1985
  
  Zitieren
  
  Von Locuza Lötkolbengott/-göttin
  
  Zitat von cPT_cAPSLOCK
  
  Stimmt, hier kann ich dir zustimmen. Hast Recht
  Vereinfachung beispielsweise anhand der CPU-Kerne, die eigentlich nur noch integereinheiten sind... oder hab ich da was komplett falsch verstanden?
  
  Ja, da hast du etwas zum Teil falsch verstanden. Der Bulldozer stellt keine Vereinfachung dar, sondern sogar eine "Verkomplizierung". Ein klassischer CPU-Kern sah früher wie eine Pizza mit einer großen Salami aus.
  Der Bulldozer ist eine geschnittene Pizza. Vorteil: Du kannst 2 Menschen damit füttern, die Stücke sind aber nur halb so groß.
  
  Metapher bei Seite, eine CPU besteht aus paar Zutaten wie Integer Kernen, L1,2 etc. Caches, Pipelines,Dekodern, ALUs, AGUs, FPUs et cetera.
  Das Konzept hinter Bulldozer zielt auf einen totalen Kompromiss ab. Die FPU ist meistens sehr mächtig und dreht bei einem Integer-Kern oft Däumchen. Klar das verbraucht Platz und Effizienz, deshalb hat ein Core jetzt 2 Integer-Kerne um Platz zu sparen und eine FPU besser aus zu lasten. Die Integer-Kerne sind aber schwächer als die alten Rechenkerne, aber dieser Schwäche will man mit dem Turbomodus entgegen treten. Im Prinzip ist der Bulldozer sehr intelligentes Konzept, was an zu vielen kleinen Ungereimtheiten scheitert.
  Das Ziel ist es den besten Kompromiss aus Platz und Perf/Watt zu finden. Einheiten deren Leistungskraft brach liegt, werden besser ausgenützt, durch mehrere Integer-Kerne können mehr Threads verarbeitet werden, sind weniger Threads vorhanden dann wird aufgrund der eher schwachen Kerne hoch getaktet, um dennoch genug Performance zu liefern und die anderen Module ausgeschaltet um Strom zu sparen.
  
  Um es dir zu verdeutlichen. Ein Bulldozer-Modul hat 4 Dekoder die 2 Integer-Kerne füttern. Ein Phenom Integer-Kern hat 3 Dekoder die ihn füttern. Bulldozers Integer-Kerne haben 2 ALUs und 2 AGUs, also der eine rechnet, der andere adressiert und ein Phenom Kern hat 3 jeweils von beiden. Dann gibt es noch den L1-Cache, den L2 Cache und ihre Latenzen. Bulldozer hat einen sehr kleinen L1-Cache, L2 ist größer und L3 auch, aber die Caches an sich sind noch einmal eine ganze Spur langsamer.
  Also man sieht auf den ersten Blick das der Bulldozer noch nicht perfekt abgestimmt ist. Bei einem Phenom kann man die Vermutung führen, dass viele Ressourcen overpowered sind und gar nicht ausgenützt werden und beim Bulldozer kann man sich Vorstellen, dass nicht alle Einheiten auch wirklich ausgenützt werden können.
  
  Zitieren
  
  Von Brehministrator BIOS-Overclocker(in)
  
  Zitat von X-CosmicBlue
  
  Da 5632 GFlops 5,632 TFlops, in Worten 5 Komma 632 TFlops, sind, steht es im Artikel richtig. Er hat einfach im Kopf umgerechnet, so wie ich. Siehe oben.
  
  Ah, stimmt. Sorry. Ich habe das Komma fälschlicherweise als Tausender-Trennzeichen aufgefasst, wie es im Englischen Sprachraum auch üblich ist. Aber es ist ja ein Deutscher Artikel
  
  Zitieren
  
  Direkt zum Diskussionsende

Hoch

Print / Abo

Apps

Die Redaktion Datenschutz Artikel-Archiv Datenschutz-Optionen Mediadaten Impressum Utiq verwalten Abo kündigen Vertrag widerrufen AGB Inhalt melden Newsletter

Artikel teilen

Kommentare (21)