Radeon HD 4800: Effizienz und Präzision
In den ersten Benchmarks der Radeon HD 4850 überraschte die Karte viele mit ihrer Leistungsfähigkeit. Heute sehen wir uns an, warum das so ist.
Effizienzsteigerung
Auch AMD war mit der Geometry-Shaderleistung seiner GPU nicht zufrieden, obwohl diese deutlich über der Leistung der Geforce-Karten lag, und hat ebenfalls den Ausgabepuffer vergrößert. Ein Faktor von 4 steht hier im Raume, abgeleitet von der vierfachen Anzahl der Rendering-Threads, welche der RV770-Chip nun unterstützt. Die Radeon-Karten dürften in den meisten Geometry-Shader-Programmen also nach wie vor schneller arbeiten als vergleichbare Geforce-Karten. Zusätzlich verbesserte AMD die Tesselations-Einheit, welche die DX10-Radeons von der Xbox-360-GPU geerbt haben. Diese war zuvor nicht in der Lage, instanzierte Datenströme zu verarbeiten und nur über einen Umweg vom Spieleentwickler ansprechbar. Der neue Tesselator im RV770 ist AMDs Angaben zufolge Direct-X-10/10.1-kompatibel.
Der Hauptteil der Arbeiten floss allerdings in die Reduktion der nötigen Chipfläche für alle möglichen Funktionseinheiten - ganz nach der Maxime, die höchstmögliche Leistung pro Quadratmillimeter Chipfläche zu erreichen. Durch manuelles Feintuning konnte die Leistung pro Quadratmillimeter um 40 Prozent gegenüber der HD-3800-Reihe verbessert werden - zudem wurden noch weitere Features hinzugefügt, die besonders den GP-GPU-Bereich beschleunigen. Jede der 800 ALUs ist nun in der Lage, Bit-Shift-Operationen auszuführen, sodass diese Operationen insgesamt 12,5 Mal schneller als bei der RV670 ausgeführt werden können.
Die Textureinheiten konnten sogar noch mehr zulegen: Satte 70 Prozent mehr Leistung pro Quadratmillimeter erreicht AMD nun. Wie bereits angedeutet, ging es in diesem Falle nicht ohne Einsparungen. Neben der halbierten FP16-Filterrate gegenüber den Vorgänger-Chips sind auch die zusätzlichen vier Textur-Adressierungseinheiten aus der TMU herausgefallen. Die erhöhte Anzahl der Einheiten gleicht diese Einbußen jedoch mehr als aus, sodass selbst im schlechtestmöglichen Fall noch eine 25 Prozent höhere Leistung als beim RV670 erreicht wird. Dazu tragen auch die verbesserten Level-1- und -2-Caches ihren Teil bei.
FP64: Doppelte Präzision
Für den Goldesel GP-GPU haben beide Hersteller sich ordentlich ins Zeug gelegt, um potenziellen Kunden die Rechenleistung ihrer Grafikchips schmackhaft zu machen. Neben der von Direct X 10 bekannten FP32-Genauigkeit verfügen sowohl RV670/770 als auch GT200 über die Möglichkeit, das für wissenschaftliche Berechnungen wichtige FP64-Format zu unterstützen. Da es für PC-Spiele auf absehbare Zeit eher unwichtig ist, zeigen wir hier nur kurz die interessantesten Eckdaten auf.
