AMD Trinity im Kurztest: Die zweite APU-Generation
Mit Trinity schickt AMD die zweite Generation an Accelerated Processing Units (APUs) ins Rennen. Diese nutzen Piledriver-CPU-Module sowie eine VLIW4-Grafikeinheit und sollen im Bereich von 17 bis 35 Watt TPD den Intel-Chips der Pentium- plus Core-i3-Reihe das Leben schwer machen.
Während die FX-Prozessoren (siehe Bulldozer-CPUs im Test) im Desktop-Segment einen schweren Stand haben, verkauft sich die Brazos-Plattform wie geschnitten Brot und auch die APUs der A-Serie auf Llano-Basis sind gerade bei den OEMs sowie Systemintegratoren gefragt. Dies gilt neben der Lynx-Plattform vor allem für die mobile Sabine-Variante, weswegen sich AMD dazu entschieden hat, die zweite Generation der A-Serie vorerst nur Notebooks zu veröffentlichen. Die sogenannte Comal-Plattform ist ab heute verfügbar, das Desktop-Pendant Virgo ist ab Anfang Juni bei den OEMs und im dritten Quartal wird dann der Endkunden-Markt beliefert.
Die Comal-Plattform für Trinity
Hinter dem Codename Comal verbirgt sich die Kombination aus einer Trinity-APU und dem A70M-Chipsatz, auch FCH (Fusion Controller Hub) genannt. Der A70M alias "Hudson-M3" bietet vier native USB-3.0-Ports, die Anzahl der USB-2.0-Ausgänge liegt bei zehn, wie gehabt stehen bis zu sechs SATA-6Gb/s-Anschlüsse bereit. Die TDP des A70M liegt bei 4,7 Watt.Die eigentliche APUs nennt sich Trinity und kombiniert ein oder zwei Module auf Basis der Piledriver-Architektur mit einer sogenannten Northern-Islands-Grafikeinheit. Mit im Chip stecken zudem 24 PCI-Express-2.1-Lanes (vier davon für den FCH) und die Northbridge samt Speichercontroller. Letzterer unterstützt im Falle der mobilen Chips bis zu DDR3-1600 samt Low-Power-DDR3, die Desktop-Pendants DDR3-1866.
Quelle: AMD
AMD Trinity: Neben der VLIW4-GPU befinden sich zwei Module mit Piledriver-Architektur, der Speichercontroller und die 24 PCI-Express-2.1-Lanes mit im Chip
Unter der Haube: Piledriver und VLIW4
Die Fertigung der Trinity-APUs erfolgt bei Global Foundries im 32-Nanometer-Verfahren samt Hi-K Metal Gate, alle Chips entstammen dem A1-Stepping (Llano war B0, Ivy Bridge gar E1). Mit 246 Quadratmillimetern Die-Fläche ist der Chip größer als eine Llano-APU mit seinen 228 Quadratmillimetern, dafür stecken aber auch 1.303 statt 1.178 Millionen Transistoren in der Accelerated Processing Unit [Anm.d.R.: Beim Llano-Release gab AMD noch 1.450 Millionen an].
Die Piledriver-Technik ist eine leicht verbesserte Bulldozer-Architektur, im Gegensatz zu den FX-Prozessoren muss Trinity jedoch auf die dritte Cache-Stufe verzichten; der L2 fasst pro Modul wie gehabt zwei MiByte. AMD spricht von Verbesserungen beim Frontend und den Caches, die eigentlichen Recheneinheiten bekamen unter anderem einen Hardware-Divider spendiert (die entsprechende Folie existiert nur als Leak, in unserem PDF-Deck fehlt sie einfach). Im Vergleich zu den Husky-Kernen der Llano-APUs reicht dies aber nicht um pro Takt mehr Leistung zu erzielen, Trinity ist daher für höhere Frequenzen ausgelegt. Neue Befehlssatz-Erweiterungen gibt's in Form von FMA3 und F16C ebenfalls.
Hinter der Northern-Islands-Grafikeinheit verbirgt sich eine GPU mit VLIW4-Technik, bekannt durch die Cayman-Radeons HD 69x0. Mit bis zu 384 Shadern bietet diese nominell weniger Recheneinheiten als die schnellste Llano-GPU (die HD 6620G), was Trinity jedoch durch den Takt mehr als egalisiert. Neben DirectX 11 unterstützt die iGPU natürlich auch Open CL, Open GL, HTML5 und Flash. Den UVD3 (Unified Video Decoder) vermarktet AMD als HD Media Accelerator, hinzu kommt der Accelerated Video Converter (besser bekannt als VCE von den Radeon HD 79x0/78x0/77x0) - ein in Hardware implementierter Encoder für H.264. Die Kombination soll für 1080p-Material in bestmöglicher Qualität herhalten, AMD sieht sich hier klar im Vorteil - wobei die (im Treiber abschaltbaren) Aufwertungen Videos Strom kosten, das sollte man hier nicht vergessen. In Sachen Anschlüsse bietet die iGPU neben HDMI, DP 1.2 und DL-DVI auch den guten alten D-Sub.
Quelle: AMD
AMD Trinity: Der Turbocore 3.0 am Beispiel des A10-4600M
Die Modelle samt Turbocore 3.0 und Power Gating
Am heutigen Tag stellt AMD fünf mobile Trinity-APUs vor, im Gegensatz zu den Llano-Chips fehlt die 45-Watt-TDP-Klasse; Dafür expandiert der Hersteller nach unten und bringt ein 17-Watt-ULV-Modell für den Ultrathin-Markt (im Desktop-Segment behält AMD die 65 und 100 Watt bei). Das Flaggschiff, welches AMD einigen wenigen Redaktionen in Form eines 14-Zoll-Gerätes von Comal zur Verfügung stellte, ist der A10-4600M samt der Radeon HD 7660G. Konnte man bisher an der Bezeichnung A10 und Co. erkennen, was für eine Grafikeinheit verbaut ist, klappt dies nun nicht mehr - denn der A10-4655M mit 25 Watt TDP nutzt nur eine HD 7620G. Warum der Chip die höchste Bezeichnung trägt, dabei aber nicht das schnellste Modell ist, weiß wohl nur AMD ... und Intel, die den ULVs ebenfalls kuriose Namen verpassen.
Der Turbo der dritten Generation ist bei allen Modelle aktiv und agiert dynamisch in drei Stufen, abhängig von der Auslastung von GPU sowie CPU. Im Falle des A10-4600M liegen 2,3 GHz an wenn die Radeon HD 7660G schwer arbeiten muss, bei leichter Last darf die CPU bis zu 2,7 GHz anlegen und wenn die iGPU rein gar nicht gefordert ist, sind es gar 3,2 GHz. Im Gegenzug kann sich die Radeon HD 7660G von 497 auf bis zu 686 MHz hochschrauben. Im Leerlauf sinkt die CPU-Frequenz auf 1,4 GHz (7x 200 MHz) und Power Gating deaktiviert nicht benötigte Chipteile, darunter einzelne Module, die GPU-Kerne, den UDV3 oder das PCI-Express-Interface.
| Modell | Kerne | Takt (Turbo) | GPU | ALUs | Takt (Turbo) | Speicher | TDP |
|---|---|---|---|---|---|---|---|
| A10-4600M | 4 | 2,3 bis 3,2 GHz | Radeon HD 7660G | 384 | 497 bis 686 MHz | DDR3-1600 | 35 Watt |
| A8-4500M | 4 | 1,9 bis 2,8 GHz | Radeon HD 7640G | 256 | 497 bis 655 MHz | DDR3-1600 | 35 Watt |
| A6-4400M | 2 | 2,7 bis 3,2 GHz | Radeon HD 7520G | 192 | 497 bis 686 MHz | DDR3-1600 | 35 Watt |
| A10-4655M | 4 | 2,0 bis 2,8 GHz | Radeon HD 7620G | 384 | 360 bis 497 MHz | DDR3-1333 | 25 Watt |
| A6-4455M | 2 | 2,1 bis 2,6 GHz | Radeon HD 7500G | 256 | 327 bis 424 MHz | DDR3-1333 | 17 Watt |
Quelle: AMD
AMD Trinity: Dual Graphics im Überblick
Dual Graphics reloaded
Die integrierten Radeons können wie schon bei Llano per asymetrischem Crossfire, von AMD Dual Graphics getauft, mit schnelleren und dedizierten Radeon gekoppelt werden. Hierbei handelt es sich um die Modelle HD 7670M, HD 7650M, HD 7550M, HD 7510M und HD 7450M. Entgegen der Bezeichnung steckt auch hier keine aktuell GCN-Technologie (wie bei etwa der Radeon HD 7970), denn all diese Pixelbeschleuniger sind einfach nur umbenannt. Die bedeutet , dass Sie vom "Zero Core"-Feature einer Radeon HD 79x0/78x0/77x0 (Desktop!) keinen Synergie-Effekt erwarten dürfen - dies bestätigte AMD auf Nachfrage explizit. Im mobilen Bereich klappt es per Enduro hingegen, es bleibt jedoch abzuwarten ob die Notebook-Hersteller entsprechende Geräte anbieten.
Stagnation beim CPU-Part, dafür deutlich flottere iGPU
Das 14-Zoll-Geräte von Compal (welches ganz klar ein Barebone für Dell ist) samt dickem "Prototyp System"-Schriftzug löst mit vergleichsweise niedrigen 1.366 x 768 Pixeln auf, neben dem A10-4600M ist der A70M-Chipsatz verbaut und alle Daten landen auf einer 128-GByte-SSD aus Samsungs 830er-Serie; als OS dient Windows 7 x64 SP1 samt den FX-Hotfixes und der Catalyst 8.945RC2 beschleunigt die Radeon HD 7660G. Der Akku bringt es auf 4,84 Amperestunden und vdie beiden beiden DDR3-1600-Module fassen jeweils 2.048 MiByte. An dieser Stelle sei angemerkt, dass wohl kaum ein Hersteller ein solches Gerät veröffentlichen dürfte, das Comal-Book ist daher ganz klar als Best Case zu betrachten - gerade die flotte SSD und der schnelle Speicher dürften durch eine HDD und DDR3-1333 ersetzt werden.
Quelle: AMD
AMD Trinity: Der A10-4600M im A1-Stepping
Was den CPU-Teil angelangt, so sind die zwei Module des A10-4600M mit 2,0 Punkten im Cinebench R11.4 x64 nicht schneller als die vier Kerne des A6-3520M mit 1,6 GHz - das Trinity-Flaggschiff ist bei gleicher TDP also kein Fortschritt! Gegen einen einen mobilen Core i3 oder gar i5 auf Sandy-Bridge- respektive Ivy-Bridge-Basis ist für daher AMD wie gehabt nichts zu holen, diese sind je nach Modell 20 bis fast 50 Prozent schneller unterwegs (von einem i7 ganz zu schweigen, welcher aber wie die i5 in einem höheren Preissegment angesiedelt ist). Bei Integer-Workloads dürfte Trinity jedoch besser dastehen.
In Sachen 3D-Performance ist die Radeon HD 7660G einer Intel HD Graphics 4000 dafür im 3D Mark 11 um gute 50 Prozent überlegen. Die Akkulaufzeit ist mit drei bis sieben Stunden erfreulich hoch, wenngleich wir für eine finale Bewertung auf Serien-Notebooks warten werden. Die Messungen aber deuten an, dass es der A6-4455M im 17-Watt-Segment nicht nur bei der CPU- sondern auch bei der iGPU-Leistung gegen Intels ULV-Modell schwer haben wird. Die 35- und 25-Watt-Trinitys hingegen zeigen die höchste iGPU-Leistung die wir jemals gesehen haben, wer also unterwegs häufiger zocken möchte oder etwa mit Open CL arbeitet, ist hier gut beraten. Die Benchmarks finden Sie bei den Kollegen von Golem.
Ein vorläufiges Fazit
Während wir derzeit für die kommende Print-Ausgabe 07/2012 unsere eigenen Messungen anstellen, lässt sich anhand der bisherigen Resultate und Erfahrungen zumindest so viel sagen: AMD hat mit Trinity den Vorsprung bei der Grafikleistung ausgebaut, die Effizienz des CPU-Parts leicht verbessert und die generelle Akkulaufzeit erhöht - Schwächen gibt's wie gehabt bei der (leicht gesteigerten) Performance des Prozessors, für den Alltag ist diese aber dennoch völlig ausreichend und gerade mit einer SSD fühlt sich ein Trinity-Notebook an wie ein Desktop-Rechner.
Es bleibt abzuwarten ob und vor allem wann die Hersteller die Vorarbeit von AMD in gelungene Geräte umsetzen - zu wünschen wäre es, denn Stand heute sieht es nicht danach aus, als ob der Markt von Trinity-Notebook überflutet wird. Wie bei Llano wird es hier ein bisschen dauern, vor allem schlanke Modelle mit den 17-Watt-ULVs dürften erst in ein paar Wochen erscheinen.

So ein Test würde mich noch einmal interessieren. Aber so wie es scheint, ist die CPU an sich nicht schlecht. Geht besser, allerdings schon mal der richtige weg.
Von der GPU Leistung brauch man gar nicht Anfangen. Was iGPU angeht, sieht Intel gegen AMD keine Sonne so schnell.
Piledriver ist nur ein kleines Update von Bulldozer, deshalb darf man da auch nur kleinere Verbesserungen erwarten. Der geringe Takt und der neu eingeführte Resonant Clock Mesh führen wohl primär zur deutlich besseren Verlustleistung im Vergleich zu Bulldozer.
Die CPU ist ersten Ergebnissen wohl in ST etwas schneller, weil der Turbo höher anliegt und im MT sind sie auf ungefähr gleicher Perf.
Leider hast du im Bezug auf die GPU nicht ganz Recht, denn Intel sieht da mittlerweile deutlich mehr Sonne, als AMD bei der CPU-Leistung.
Die GPU bei Trinity macht gar keinen so großen Sprung, da die meisten Hersteller auf Dual-Channel verzichten werden und unter einem A10 die iGPUs stark abgespeckt werden.
Also in der Standardausführung ist Trinity oft schlecht aufgestellt, wenn man sich für 20 Euro zusätzlich noch ein Ram dazu steckt, dann wird man den Aufbau auch sinnvoll fahren.
So ein Test würde mich noch einmal interessieren. Aber so wie es scheint, ist die CPU an sich nicht schlecht. Geht besser, allerdings schon mal der richtige weg.
Von der GPU Leistung brauch man gar nicht Anfangen. Was iGPU angeht, sieht Intel gegen AMD keine Sonne so schnell.
Vielleicht bringt ja der nächste Shrink auf 28nm etwas.
Inklusiv L3 + ca. 15%, von Llano zu Trinity sind es ca. 11%.
- Systemverbrauch? Nicht wirklich überzeugend... (Hier sehe ich die einzige Chance für AMD ihre Produkte interessant zu machen)
- reine GPU- Leistung? Auch nicht sehr überzeugend im Vergleich zur HD4000
- CPU- Leistung? Vergessen wir besser...
- APU mit GPU kombinierbar? Noch nicht ausgereift, dann lieber gleich ne richtige GPU
- hohe Taktraten möglich? Hatte Intel das nicht schon mit dem Pentium 4 versucht?
Seit meinem K6-300 hatte ich ausschließlich AMD Produkte, aber ich bekomme zweifel ob das Warten auf Vishera sich lohnt.
Ich den genauen Link hab ich jetzt nicht.
Also ich weiss jetzt leider nicht mehr wo ich es gelesen habe, aber der L3 Cache so unter Windows Anwendungen nicht viel mehr als knapp 10% bringen.
Nun ja, wenn die neue Generation wirklich um 15% CPU Lastig zugelegt haben sollte und wir dann noch den zusätzlichen L3 Cache hinzu rechnen, dann kämen wir so auf ein Plus von ca. 25%, was nun nicht gerade berauschend ist. Damit käme der Bulldozer Nachfolger mit etwas Glück nicht viel weiter als SandyBridge, sofern ich die alten Vergleichzahlen noch richtig im Kopf habe.
Um mit Ivy bzw. der nächsten Generation mithalten zu können, müssen die aber noch einiges mehr finden.
Vielleicht bringt ja der nächste Shrink auf 28nm etwas.
Warten wir´s mal ab, ich kann es zumindest mit meinem Phenom x4 960T.
Gruß