GF100-Mysterium lüftet sich

Geforce GTX 470/480: Füllraten-Rätsel gelöst

Die Geforce GTX 480 hat die Krone als schnellste Single-GPU-Grafikkarte zu einem hohen Preis in Sachen Lautheit und Leistungsaufnahme zurückerobert. Doch noch immer sind einige Details unklar: Füllratentests zeigen teils ungewöhnlich niedrige Werte. Was ist hier los? (Carsten Spille, 07.04.2010)
 
Fermi gibt weiter Rätsel auf
 
Fermi gibt weiter Rätsel auf [Quelle: siehe Bildergalerie]
Die Geforce GTX 480 kann die konkurrierenden Radeon-Karten in Sachen Fps schlagen, obwohl sie in vielen Bereichen weitaus weniger Rohleistung aufweist. Doch wieviel weniger ist es eigentlich? Besonders die Füllraten, also der Spitzendurchsatz bei bestimmten Pixel-Operationen, als althergebrachtes Maß für die Leistungsfähigkeit einer Grafikkarte, verdient Beachtung.

Falls Sie weitere Details zur Geforce GTX 480/470 oder der Fermi/GF100-Architektur benötigen, oder sich einfach noch einmal einlesen möchten, empfehlen wir unsere früheren Artikel zum Thema:
Geforce GTX 470 und GTX 480: Test von Nvidias GF100-Generation
Fermi GF100 im Technik-TÜV: Kommentare zu Architekturdetails, Bildqualität und Benchmarks

Was sind Füllraten und wie setzen Sie sich zusammen?
Füllraten setzen sich normalerweise aus dem Durchsatz einer bestimmten Hardware-Funktionsgruppe, deren Anzahl und dem jeweils relevanten Takt zusammen. Zum Beispiel erreicht eine Radeon HD 4850 eine Pixel-Füllrate von 10 Milliarden Pixeln pro Sekunde (10 Gpix/sek.): Sie verfügt über 16 Raster-Endstufen, welche mit einer Taktrate von 625 MHz betrieben werden. Eine HD 5870 erreicht theoretisch bereits 27,2 GPix/sek. (32 ROPs * 850 MHz).

Je nach Füllrate sind auch andere Faktoren maßgeblich: So wird die Texturfüllrate durch die Anzahl der Textureinheiten, den Durchsatz pro Takt und den Takt selbst bestimmt. FP16-Texturen (64 Bit insgesamt) werden in der Regel in zwei Taktzyklen verarbeitet, 32-Bit-Integer-Formate üblicherweise in einem. Eine Geforce GTX 285 erreicht hier also mit 80 TMUs bei 648 Takt (hier zählt die Base-Clock, nicht die Shader-Hot-Clock von 1.476 MHz) 51,84 GTex/sek, eine HD 5870 erreicht mit 68 Gtex/sek. (80 TMUs * 850 MHz) deutlich mehr. Je nach Format können die TMUs aber unterschiedlich mächtig ausgelegt sein.

Für das RGB9E5-Format, welches einen höheren Dynamikbereich bietet, brauchen Nvidias TMUs zwei Zyklen, AMDs dagegen nur einen. Hier sieht das Texturfüllratenverhältnis also 25.92 zu 68,0 GTex/sek. In der bilinear gefilterten Praxis erreicht AMD etwa 98 % Effizienz und Nvidia (bei der GTX 285) etwa 81 %. Eine GTX 480 käme beim RGB9E5-Format theoretisch auf 700 MHz * 60 TMUs / 2 Takte = 21 Gtex/sek, und erreicht in der Praxis bei den TMUs davon über 99 %.

Pixelfüllrate der GTX 480
Klassischerweise sind die Füllraten folgendermaßen limitiert:
• Pixel-Füllrate: Anzahl/Durchsatz/Takt der ROPs
• Texel-Füllrate: Anzahl/Durchsatz/Takt der TMUs
• AA-Sample-Füllrate: Anzahl/Durchsatz/Takt der ROPs

Bereits zuvor erfuhren wir, dass die Pixel-Füllrate bei der GTX-400-Reihe nicht mehr von der Anzahl der ROPs dominiert wird, da hier pro Takt ein höherer Durchsatz erreicht wird, als die Shader-Engine zu liefern imstande ist (s. PCGHx.com-Technik-Talk mit Nvidia). Die 48 ROPs können 48 Pixel pro Takt durchschleusen, sofern sich diese zum Beispiel im 32-Bit-Format RGBA8 befinden. Bei FP16-Pixel, repräsentiert als RGBA16 mit insgesamt 64 Bit, benötigen sie zwei Takte, für FP32 vier. Auch das 32-Bit-Format RGB9E5, bei dem jeder der drei Farbkanäle, die sich einen 5-bittigen Exponenten teilen, 9 eigene Bits abbekommt, muss genauso in zwei Takten bearbeitet werden, wie andere FP10- oder -11-Formate.

Soweit keine Überraschungen, das war schon bei vergangenen Generationen von Nvidia-ROPs der Fall. Allerdings werden sie pro Takt nur mit maximal 30 Pixeln aus der Shader-Engine gefüttert (21 GPix/sek.) und können ihre Zahl und Stärke eigentlich nur Operationen ausspielen, die mehr als einen Takt pro Pixel erfordern. So sollten beim FP16-, FP10- oder RGB9E5-Format die 30 Pixel pro Takt ausreichen, um die ROPs mit 48/2=24 Pixel pro Takt zu sättigen.

In unseren internen Tests und beim Geforce-GTX-480-Test der Kollegen von Hardware.fr fiel hingegen auf, dass die Geforce GTX 470 und 480 in einigen Fällen deutlich hinter dem zurückblieb, was wir aufgrund der technischen Daten eigentlich erwartet haben. Zum Beispiel hätte man erwarten müssen, bei 32-bittigen FP10-Formaten wie zum Beispiel RGB10A2 oder auch RGB9E5, die Hälfte des maximalen ROP-Durchsatzes von 33,2 GPix/sek, also rund 16,8 GPix/sek. zu erreichen. De facto waren es jedoch lediglich rund 10 GPix/sek. - was war hier los?

Der Füllraten-Test der Kollegen von Hardware.fr zeigt, dass die Geforce GTX 400 sich nicht immer so verhält, wie man es erwarten würde. Besuchen Sie auch deren Test bei Hardware.fr
 
Der Füllraten-Test der Kollegen von Hardware.fr zeigt, dass die Geforce GTX 400 sich nicht immer so verhält, wie man es erwarten würde. Besuchen Sie auch deren Test bei Hardware.fr [Quelle: siehe Bildergalerie]


In einem kleinen Email-Marathon mit Nvidias Technical-PR (in Form von Lars Weinand und James Wang aus dem Team von Nick Stam - vielen Dank an dieser Stelle!) haben wir über die Ostertage versucht zu ergründen, warum die Geforce GTX 470 und 480 hier so stark "absaufen". Schließlich stellte sich folgendes heraus: Der Datenpfad zwischen Shader-Engine und ROPs ist auf das Datenaufkommen von bis zu 32 32-bittigen Pixeln optimiert - soviele könnte ein GF100-Chip im Vollausbau mit 512 ALUs/16 SMs/4 GPCs liefern. Sobald ein Format in den ROPs eine höhere Präzision benötigt, muss auch hier die Belegung der Datenpfade geändert werden, sodass das 32-Bit-Format RGB9E5 (vermutlich durch seine 9 Bit pro Farbkanal) intern dieselbe Bandbreite verschlingt, wie ein FP16/64Bit-Pixel. Dadurch bleibt auch in diesen Formaten die Output-Leistung der Shader-Engines, also der vier GPCs, bestimmend für die Füllrate und nicht, wie erwartet, die ROPs. Deren vergleichsweise hohe Anzahl ist laut Nvidia lediglich dazu gedacht, die Speicher- und Antialiasing-Leistung zu steigern.

(Ansicht vergrößern für Quellenangaben)
     
 
 
Alle Artikel zu Grafikkarten von Nvidia und AMD/Ati finden Sie auf der Grafik-Themenseite. Eine aktuelle Grafikkarten-Kaufberatung finden Sie im Artikel Ati- und Nvidia-Grafikkarten: Test-Übersicht und aktuelle Kauf-Tipps. Mehr zum Geforce-Entwickler Nvidia und Radeon-Entwickler AMD erfahren Sie in unseren Themen-Specials.
 
 
 
Verwandte Artikel:   Geforce   GTX 480   GTX 470   Nvidia   Grafikkarte   Füllrate  
 
 
  1. Gigabyte GeForce GTX 670 OC
    € 377.90
  2. Palit GeForce GTX 670
    € 329.00
  3. ASUS GTX670-DC2T-2GD5
    € 408.90
  4. Palit GeForce GTX 670 JetStream
    € 377.50
  5. Sapphire Radeon HD 7850
    € 209.80
  6. ASUS GTX670-DC2-2GD5
    € 394.70
  7. Sapphire Radeon HD 7850 OC
    € 218.90
  8. Sapphire Radeon HD 7870
    € 284.30
  9. Gainward GeForce GTX 670 Phantom
    € 389.99
  10. EVGA GeForce GTX 670
    € 357.90
 
Aktuelle Kommentare
Thaquanwyn
Schraubenverwechsler
10.04.2010 01:51
AW: Geforce GTX 470/480: Füllraten-Rätsel gelöst

Quote: (Zitat von VNSR)
Die GTX280 hat beim Release auch 500€ gekostet. Und was die 150-200€ angeht, denke ich, dass es bei ebay in einem 3/4 Jahr kein Problem mehr wird.


... nur mit dem kleinen aber feinen Unterschied, dass die GTX 480 in einer viel geringeren Stückzahl zur Verfügung stehen wird und somit immer ziemlich rar bleiben dürfte ...

Two-Face
PCGH-Community-Veteran
09.04.2010 13:32
AW: Geforce GTX 470/480: Füllraten-Rätsel gelöst

Quote: (Zitat von VNSR)
Die GTX280 hat beim Release auch 500€ gekostet. Und was die 150-200€ angeht, denke ich, dass es bei ebay in einem 3/4 Jahr kein Problem mehr wird.


In einem 3/4 Jahr gibt's dann aber evtl. schon wieder bessere Karten.

VNSR
Software-Overclocker
09.04.2010 13:30
AW: Geforce GTX 470/480: Füllraten-Rätsel gelöst

Quote: (Zitat von Thaquanwyn)
... wenn du tatsächlich darauf warten willst, dass du eine GTX 480 für 150-200€ bekommst, könnten deine Haare in der Zwischenzeit möglicherweise leicht gräulich werden ...


Die GTX280 hat beim Release auch 500€ gekostet. Und was die 150-200€ angeht, denke ich, dass es bei ebay in einem 3/4 Jahr kein Problem mehr wird.

 
 
1925 User online
Anmelden & mitmachen
Benutzername:
Kennwort:
Angemeldet bleiben
Jetzt mitdiskutieren!
Jetzt bestellbar!
Alles zu Crysis 3
Die besten Deals
Komplett-PCs von PCGH
Komplett-PCs von PCGH
So unterstützen Sie PCGH
Folgen Sie PCGH
Aktuelle Heft-Ausgabe
Print: PCGH-Testdatenbank schon ausprobiert?
Ja, nutze ich oft (5.59%)
Ja, nutze ich gelegentlich (17.70%)
Nein, habe ich aber vor (14.29%)
Nein, ist mir nicht aufgefallen (22.36%)
Nein, bin Magazin-Leser, keine DVD (14.60%)
Nein, bin Online-Leser (23.29%)
Sonstiges (siehe Kommentar) (2.17%)
322 Teilnehmer
PCGH-Webshops