AMD Kaveri: Leicht überarbeitete Chipsätze, mögliche Vorstellung am 11. November und angeblich nur DDR3-Speicher
AMD hat jüngst neue Details zu den Controller Hubs für den Sockel FM2+ enthüllt, bei denen im Detail ein paar Kleinigkeiten geändert wurden. Die dafür zugeschnittenen Kaveri-APUs soll AMD bereits am 11. November auf einem Event vorstellen oder zumindest anteasern. Derzeit machen zudem Gerüchte die Runde, dass AMD bei Kaveri wohl keinen GDDR5-Speicher unterstützen wird.
Dieser Tage haben mehrere Informationen zu AMDs Kaveri-APUs das Internet erreicht. Zum einen betreffen diese den Controller Hub für den Sockel FM2+, bei dem es mehrere kleinere Änderungen geben soll. Demnach kommt der Raid-Treiber der Chips A88X und A78 mit einer neuen Software. Stammte diese bisher von Promise, zeichnet nun Dot Hill dafür verantwortlich. Ob und welche Änderungen damit einhergehen, ist offen. Unserer Kollegen von Golem spekulieren, dass Trim bei Raids im Bereich des Möglichen liegen. Bisher bot AMD diese Funktion nicht an. Auch Verbesserungen für USB 3.0 sollen die neuen Hubs enthalten.
Was die Vorstellung der APUs der 7000er-Reihe angeht, bringt die Gerüchteküche nun den 11. November ins Gespräch. Selbst wenn AMD an diesem Datum Kaveri nicht vorstellen sollte, sei zumindest eine kleine Vorschau denkbar. Schließlich veranstaltet AMD am 11. November seinen APU'13 Event, bei dem man sicherlich aus dem vollen Schöpfen möchte. Beim GPU'13-Treffen schrieb man bereits im September mit der Vorstellung der Hawaii-GPUs Schlagzeilen.
Im Schweif des APU-Events tagt auch der AMD Developer Summit. Dort kommen Entwickler zusammen, deren Software von CPUs und Open-CL-beschleunigten GPUs profitieren. Das APU'13-Event findet im US-amerikanischen San Jose statt und soll live ins Internet übertragen werden. Die Agenda für das Treffen finden Sie am Ende der Meldung. Unter anderem wird erwartet, dass AMD "some big announcements" im Zusammenhang mit seiner HSA-Initiative (Heterogeneous System Architecture) vorhat.
Unterdessen hat eine als zuverlässig eingestufte Quelle aus China angeblich Kenntnis davon erhalten, dass Kaveri nur mit DDR3-Speicher zusammenarbeitet. In der Vergangenheit wurde immer wieder gemunkelt, dass auch Kombinationen mit GDDR5-Speicher im Bereich des Möglichen liegen. Vorbild wäre hierbei die Playstation 4, deren AMD APU auf einen gemeinsamen GDDR5-Speicher zugreift. Ob und wie stark die geringe Bandbreite von DDR3-Speicher künftige APUs limitiert, muss sich allerdings noch zeigen. Aktuelle APUs der Richland- oder Trinity-Reihe profitieren teils deutlich von hohen Speichertaktraten und der damit einhergehenden Bandbreite.
Die Agenda des APU'13-Events:
4:00 - 5:00 p.m. (PST), Monday, November 11:
- Lisa Su, senior vice president & general manager, Global Business Units, AMD: "Developers: The Heart of AMD Innovation"
- Phil Rogers, corporate fellow, AMD: "The Programmers Guide to Reaching for the Cloud"
8:30 - 9:30 a.m. (PST), Tuesday, November 12:
- Mike Muller, CTO, ARM: "Is There Anything New in Heterogeneous Computing?"
- Nandini Ramani, vice president, Java Platform, Oracle Solutions: "The Role of Java in Heterogeneous Computing, and How You Can Help"
1:15 - 2:15 p.m. (PST) Tuesday, November 12:
- Dr. Chien-Ping Lu, senior director, Mediatek USA: "How Many Cores Will We Need?"
- Tony King-Smith, executive vice president, Marketing, Imagination Technologies: "Silicon? Check. HSA? Check. All done? Wrong!"
8:30 - 9:30 a.m. (PST), Wednesday, November 13:
- Dominic Mallinson, senior vice president, Software, Sony: »Inside PlayStation 4: Building the Best Place to Play«
- Brendan Iribe, CEO, Oculus VR: "Virtual Reality - A New Frontier in Computing"
1:15 - 2:15 p.m. (PST) Wednesday, November 13:
- Johan Andersson, technical director, DICE: "Rendering Battlefield 4 with Mantle"
- Mark Papermaster, CTO, AMD: "Powering the Next Generation Surround Computing Experience"
Quelle: Golem, Techpowerup, expreview

Im Bereich Workstations/Server macht Quad-Channel Sinn und ist auch nicht so die Neuerung. Dual-CPU-Xeons waren schon zu So775-Zeiten damit unterwegs (damals natürlich nur 1x4, aber die Komplexität ist vergleichbar). In diesem Bereich würde ich sogar noch größere Systeme für möglich (wenn auch vorerst nicht nötig) halten, einfach weil die Produktionskosten im Vergleich zu Entwicklung und Endpreisen relativ klein sind. Unterhalb davon muss man aber einfach gucken, wieviel Plattformen man sinnvoll platzieren kann - und mit derzeit zwei ist man imho schon ganz gut dabei. Da für den Office-Bereich single-Channel gesetzt ist und sich dort auch Synergien mit ultraportable ergeben, bleibt genau eine Plattform, die auch Einsteiger-Multimedia-PCs abdecken muss. Und da ist Dual-Channel die angemessen Lösung.
Bezüglich RAM-on-Substrat: Man müsste schon etwas größere MCMs nutzen, als heute. Aber z.B. Knights Landing wird sicherlich nicht hinter den aktuellen Xeon Phi mit bis zu 16 GB RAM zurückbleiben und den RAM auf dem Substrat integrieren. De facto haben wir damit schon einen vollintegrierten, x86 tauglichen Prozessor - auch wenn er vorerst auf einer Karte statt einem Mainboard platziert wird und auf hochparallele Aufgaben optimiert ist. Aber es wäre mit vertretbarem Aufwand möglich, die gleiche Technik mit einem Broadwell-DT (oder einem Haswell-E? Das Substrat hat selbst mit einem 512 Bit Interface kein Problem) zu kombinieren.
Nur die vorerst 4 stelligen Preise müssten noch sinken. Aber wenn der Markt vermehrt fixe CPU-RAM-Kombinationen nachfragt, wäre das nur eine Frage der Stückzahlen.
Ok, erst mal nochmals vielen Dank für die Zeit, die du dir nimmst und vielen Dank für die Fortführung des Topics:
Drei ganz allgemeine Kommentare und danach gute Nacht:
1. Die Rückkehr zu den Single-Channel-Plattformen ist in meinen Augen tatsächlich ein logischer Schritt, weil wir mittlerweise nach Jahren der Stagnation ja schon wirklich nah an den perfekten Office-PCs sind:
Kaum Leistungsaufnahme, keine wirklich störenden Bootzeiten mehr dank SSDs und insgesamt viel zu viel Rechenleistung für die eigentliche Aufgabe.
Das wird und hat die PC-Hersteller ja auch hart getroffen, außer aus Effizienzverbesserungen oder geplanter Obzoleszens gibt es für keinen Office-only-User mehr einen Grund den PC zu wechseln.
Von daher würde ich auch diesen Bereich komplett aus den Überlegungen zur RAM-Zukunft ausschließen, dort wird es eh nur auf geringere Fertigungskosten und weniger Leistungsaufnahme hinauslaufen!
2. Glaubst du, dass die Substrat-Integration in naher Zukunft eine ausreichende Größe erreichen wird, um ohne externen Ram zu funktionieren?
Geschwindigkeit ist da ja wirklich weniger das Problem... Ach, und eine andere Frage hätt ich auch noch: Wieso hätte Intel Quad-Channel-DDR3 einführen sollen, wenn sie in Mehrkanallösungen nicht zumindest für die nächsten Jahre eine Option sehen, um an hohe Bandbreiten zu gelangen?
3. Zu deiner Einschätzung: Aus den von dir genannten Gründen (OEMs lieben verlötet einfach...) würde ich tatsächlich alle gesockelten Varianten eher hinten anstellen.
Bei den sonstigen Einschätzungen muss ich aber sagen: Hut ab, klingt alles drei plausibel. Wobei ich trotzdem auf das breite Interface hoffe, irgendwie klingt das für mich nach mehr Nutzerkontrolle und weniger ausfallanfällig ist es auf jeden Fall---genau aus diesem Grund wird es aber dann wohl eher nicht die Realität werden...
Pff - gaaaanz schwer abzuschätzen, da laufen zuviele Entwicklungen gegeneinander.
Und allgemein etwas weit ab vom Thema
Grundsätzlich kann man sagen:
Schon der 8086 hatte schon anno78 seine 16 Bit.
32 Bit Anbindung gabs erstmals 85 beim 80386.
64 Bit Anbindung hatten wir von 93 (Pentium 1) bis, in dieser Klasse, 2004/2005 (So775 mit i865 als Einstiegschipsatz respektive die ersten So939 Semprons).
128 Bit haben wir seitdem
Es sind also verdammt lange und tendenziell immer länger werdende Abschnitte, bis zur nächsten Steigerung. Und in der Vergangenheit waren immer die High-End-/Workstation-Segmente der Antrieb, die jetzt ihre eigenen Plattformen nutzen. Weiter unten gibts, abgesehen vom iGPU-Betrieb, auch wirklich 0 Gründe, etwas zu ändern - im Gegenteil, die nachträglich ergänzten Low-End-Plattformen sowohl bei AMD wie auch bei Intel haben erneut Single-Channel eingeführt, weil es zum arbeiten ausreicht.
Dem gegenüber steht halt der Trend zur immer höheren Integration und die Konsolen machen ja schon vor, dass 256 Bit eine Idee wäre.
Was die aber auch vormachen und was massiv von unten in den Markt drängt: Verlötete CPUs. Gerade im mobilen, wo ja auch iGPU-Leistung am interessantesten ist, sind die mittlerweile sehr weit verbreitet. Und Apple (schon in der Vergangenheit mehrfach Pionier für feste Integration...) hat gerade die zweite Baureihe auf verlöteten RAM umgestellt. Mit solcher Technik verschwindet natürlich das Problem des komplexen Sockels und Substrates. Umgekehrt muss man aber auch sagen: Es werden theoretisch deutlich höhere Taktraten möglich.
Und als dritte Komponente schließlich on-Substrat-Integration. Auch das ein sehr starker Trend, (Cache-)Speicher auf dem Substrat sehen wir bei der X360 und IBM-Systemen schon lange, bei Iris Pro auch genau in dem Segment und zur Lösung genau des Problems, dass wir hier besprechen. Die nächste Xeon Phi Generation wird den kompletten, großen VRAM on-substrat integrieren. Auch das würde das Problem lösen - ggf. aber zusammen mit der letztgenannten Möglichkeit, denn bislang waren die Substrate dann immer so groß, dass niemand mehr einen Sockel entwickelt hat.
Parallel läuft seit Ewigkeiten die Forschung zur Integration von DRAM on-DIE...
Welcher dieser Trends die Oberhand gewinnt - ich weiß es nicht. Wenn ich eine Wahrscheinlichkeits-Rangfolge für in 5 Jahren aufstellen sollte, wie die untere Mittelklasse mit iGPU aussieht:
1 verlötete CPUs mit Cache on Substrat
2 gesockelte CPUs mit Cache on Substrat
3 verlötete CPUs und verlöteter RAM mit hohem Takt, aber gleicher Bandbreite (z.B. 128 Bit GDDR6?)
4 gesockelte CPUs mit Cache on DIE
5 verlötete CPUs mit breiterem Interface
6 gesockelte CPUs mit breiterem Interface
1. ist einfach nur ein Wachstum des Ist-Zustandes, also sehr naheliegend. 2. Treibt etwas mehr Aufwand, um die Flexibilität der OEMs und Endkunden zu erhalten - aber zumindest erstere tendieren aus Kosten- und Platzgründen eben sowieso in Gegenrichtung und letztere sind in dem Segment zu selten. 3. ließe sich aus eine abgespeckten PS4 CPU ableiten, wäre bei Intel aber ein recht großer Schritt. Allgemein verlagert sich der Aufwand hier von der CPU aufs Board - also das genaue Gegenteil der letzten Jahre, in denen die CPU-Hersteller immer mehr Komplexität (und damit Teile der Gewinnspanne an sich gerissen haben). Imho schon recht unwahrscheinlich. 4. Ist imho das langfristige Ziel, wird aber noch länger als 5 Jahre dauern. In 10 Jahren haben wir dann vielleicht Systeme mit Cache on-DIE, RAM on Substrat und Flash-Massenspeicher On-Board. (und nichts davon wechselbar)
5. Halte ich, aus genannten Gründen, für zu aufwendig und Komplex im Endkundenmarkt. Einzig wenn Valve und AMD sich zusammentun, um aus der PS4 eine Steambox zu entwickeln, die dann auch als Board verfügbar ist, bestände eine Chance. Aber selbst wenn sie das tun, besteht wenig Anlass, es als ATX-kompatible PC-Komponente umzusetzen, anstatt eben einfach eine x86-Konsole zu bauen.
Für 6. gilt das gleiche, wie für 5. - nur dass der Entwicklungsaufwand ungleich größer wäre und der Nutzen nahe null. Denn eine derartige Plattform wäre im low-End-Bereich unnötig teuer und im High-End-Bereich sinnlos, weil die Leute ihre dedizierte GPU haben wollen. (Wenn sie das nicht mehr wollen: siehe 1/2/3)
Einziger Weg hierhin imho: GDDR5 Module erweisen sich als praktikabel + Intel dreht durch und bringt gCPUs für So2011-3, die die Hälfte der Kanäle als VRAM-Interface nutzen. Damit würde man parallel den Nutzern deutlich mehr mitdenken abverlangen, als man sich je ein Hersteller getraut hat (welcher RAM wohin? welchen RAM überhaupt wofür kaufen? Bislang hatte man nichtmal den Schneid, So754/939 oder 1156/1366 pin-kompatibel zu machen und einfach einen Kanal nicht zu nutzen) und natürlich müsste man auch die bisherigen Enthusiastboards auf einmal auf <150 € drücken. Jedes einzelne Ereignis ist schon "wenig wahrscheinlich".
Nochmals vielen Dank für deine Einschätzungen:
Glaubst du denn, dass es langfristig gesehen (also so ausgehend von fünf Jahren) im Desktop-APU-Markt mal mehr als 128Bit geben wird?
Klar, erst einmal ist das große APU-Ziel den gesamten DDR3-Grafikkartenmarkt (Notebooks!!!) zu übernehmen (vor allen Dingen für AMD sehr verlockend, damit könnte man eine ), aber hälst du es für realistisch, dass auch GDDR-Karten in Bedrängnis kommen könnten?
GDDR6 ist sicherlich kurz nach DDR4 marktreif und wird somit wieder die Lücke zwischen iGPU und dGPU vergrößern...
Einzige Chance wäre da wohl eine High-End-APU, so was im Stile eines dreimodulers mit 32 CUs und mindestens 256Bit Interface, besser mehr...
Aber ob AMD dafür genügend Kapazitäten hat...
Solange du nicht, wie selbst manche Webseiten, bei GDDR5 den Basistakt mit vier multiplizierst gehts ja noch
Wenn man sich alternativ auf den direkten Vergleich Dual vs. Triple-Channel beschränkt, bleiben +50% Speicherbandbreite. Die 20 € Aufpreis bei der CPU sind für komplexeren Controller und Substrat durchaus angemessen. 50 € Aufpreis beim Board erscheinen gerade bei kompakten µATX-Platinen, auf denen schon der Platz für die Slots knapp wird als realistisch, ein zusätzlicher Speicherriegel macht vermutlich sogar nur 70 vs. 100 €. ABER:
In deiner Rechnung fehlt komplett die zusätzliche DIE-Fläche für die größer dimensionierte GPU. Deren Leistung wirst du definitiv nicht zum Nulltarif bekommen. Wenn man es überhaupt schafft, sie zu integrieren, wären sicherlich nochmal 50-100 € Aufschlag im CPU-Endkundenpreis zu erwarten (+ gesteigerte Gewinnspanne im dann höheren Segment). Und du hättest trotzdem nicht deine angestrebte HD7790 Leistung, denn du hast nur durch Triple-Channel noch nicht deren Speicherbandbreite (dafür bräuchte es in der Tat den deutlich teureren DDR4) und vor allem nicht deren Speicherbandbreite PLUS ein Dual-Channel-Interface allein für die CPU. Um das zu erreichen, müsstest du bei gleichem Technologiestand der Speichertechnik direkt auf Quad-Channel gehen (siehe PS4), was dann noch teurer wird.
Höhere Latenz des GDDR5 RAM spielt laut Mark Cerny keine Rolle - die Konsole - PS4-Magazin.de
Klar, da sagt gerade ein Entwickler, dass die höhere Latenz keine Rolle spielen würde, aber er sagt erst einmal nichts dagegen, dass diese hohe Latenz existiert!
Ich kenn jetzt die Taktraten der PS4 nicht. Wenn der GDDR5 niedrig getaktet wird und keine entsprechend optimierten Chips zum Einsatz kommen, könnte die absolute Latenz tatsächlich höher ausfallen. "niedrig" ist schließlich immer relativ zum Takt zu betrachten (gegen SDR stinken die alle sowas von ab
Möglich ist natürlich auch, dass die Betrachtung im Interview schlichtweg in Zyklen erfolgte.
Ich glaube ehrlich gesagt nicht, dass M$ irgend einen Gedanken an die 0,x% der Konsolenkäufer verschwendet, die sich dafür interessieren, was eine Latenz ist und welche Auswirkungen sie hat. Aber unter den Technik-afinen Konsolen-Fans gibt es genauso Fanboys, wie bei Nvidia und AMD und für die ist natürlich ein ganz elementares Thema...
Ginge es nur um Technik & Verständnis, könnte man die Konsolendiskussion imho sowieso in einem Absatz beenden: Latenzkritische Opperationen betreffen typischerweise minimale Datenmengen (wenn ich mehrere KB über mehrere 100 Zyklen lade, dann ist es auch egal, dass ich 5 Zyklen länger brauchte, um den Aufruf zu starten). Somit ist die RAM-Latenz der X1 schlichtweg egal, denn genau für sowas würde man den Cache nutzen.
Aber welcher Fanboy beendet schon gerne eine Diskussion, solange die Gegenseite nicht winselnd am Boden liegt?