Quad-Crossfire gegen Quad-SLI: Mikroruckeln und Input-Lag
Quad-SLI, 3-Way-SLI oder Crossfire-X - was darf es sein? PC Games Hardware kombiniert mehrere Radeon HD 4870 X2 sowie Geforce GTX 295 und GTX 285 mit Intels Core i7 und prüft, welche Konfiguration die beste ist.
Quad-Crossfire gegen Quad-SLI: Mikroruckeln
Im Test der Geforce GTX 295 - also bei der Zusammenarbeit zweier GPUs - stellten wir erfreulicherweise fest, dass Nvidia das Problem der unregelmäßigen Frameverteilung per Treiber in populären Titeln zumindest etwas mildern konnte. Im Falle von Quad-SLI wie -Crossfire sind die Mikroruckler jedoch teilsweise derart präsent, dass einige Titel wie Stalker Clear Sky, Left 4 Dead (dt.) und Call of Duty 4 sowie World at War (dt.) trotz über 40 Fps subjektiv unspielbar sind. Unsere Messungen mit Fraps sowie dem Chernobyl-Shooter Stalker Clear Sky bestätigen dies.
Quelle: PCGH
Stalker Clear Sky: Frametimes bei vier GPUs
Die "Optimal"-Linie verkörpert das theoretische Optimum: perfekt verteilte Einzelbilder (Frames); jedes nach der gleichen Zeit ausgegeben. In der Praxis ist dies nahezu unmöglich, da aufeinander folgende Bilder niemals einen identischen Workload (Rechenlast) aufweisen - eine einzelne HD4870 oder GTX 285 liegt aber sehr nahe am Optimum. Vier GPUs dagegen legen ein extrem ruckeliges Verhalten an den Tag: Auf drei im 5-Millisekunden-Takt ausgegebene Frames folgt das Frame der vierten GPU erst nach satten 80 Millisekunden - und nur diese Lücke ist spürbar. Diese Zeit entspricht rechnerisch 12,5 Fps - der gefühlten Framerate -, denn die drei vorangegangenen Frames fühlen sich an wie ein einzelnes. Clear Sky ruckelt dementsprechend stark, zudem erhöht sich der Input-Lag. 3-Way-SLI oder Crossfire mit drei Karten mikroruckelt dagegen kaum mehr als normales SLI/CF, weder subjektiv noch objektiv.
Das folgende Video zeigt Stalker Clear Sky mit maximalen Details im D3D10.1-Renderpfad auf zwei HD 4870 X2. Achten Sie auf den Fps-Counter sowie die Ruckler bei größeren "Kameraschwenks".
Quad-Crossfire gegen Quad-SLI: Der Input-Lag
Zu diesen Beobachtungen kommt stets eine verstärkte Eingabeverzögerung hinzu (Input-Lag), die ebenfalls mit der Arbeitsweise des Alternate Frame Renderings (AFR) zusammenhängt. Quad-GPU-Systeme berechnen 4 Frames im Voraus, bevor diese nacheinander ausgegeben werden (das Limit von Vista liegt bei 4 Frames). Der Input-Lag wird deshalb bei fallender Frame-Anzahl störender. Hinzu kommt, dass aufgrund der extremen Frameverteilung ein zusätzlicher Lag auftritt: Während der 80-Millisekunden-Pause (im Falle von Clear Sky etwa) wird keine Mausbewegung umgesetzt.
Zusammenfassend lässt sich festhalten, dass zwei oder drei gekoppelte Grafikprozessoren im Vergleich zu einer Single-GPU-Karte zwar eine unsauberere Frameverteilung liefern und ein leichter Input-Lag auftritt - es hängt jedoch von Ihnen ab, ob Sie dies als störend empfinden. Quad-SLI/CF dagegen disqualifiziert sich für den Spielealltag; die extremen Mikroruckler sowie der sehr starke Input-Lag sind angesichts der Anschaffungskosten schlicht inakzeptabel.
In diesem Artikel
- Seite 1 Quad-Crossfire gegen Quad-SLI: Einleitung und Überblick
- Seite 2 Quad-Crossfire gegen Quad-SLI: Leistungsaufnahme
- Seite 3 Quad-Crossfire gegen Quad-SLI: Mikroruckeln und Input-Lag
- Seite 4 Quad-Crossfire gegen Quad-SLI: Testsystem
- Seite 5 Quad-Crossfire gegen Quad-SLI: Benchmark Crysis Warhead (D3D10)
- Seite 6 Quad-Crossfire gegen Quad-SLI: Benchmark Far Cry 2 (D3D10)
- Seite 7 Quad-Crossfire gegen Quad-SLI: Benchmark Stalker Clear Sky (D3D10)
- Seite 8 Quad-Crossfire gegen Quad-SLI: Fazit
- Seite 9 Bildergalerie
- Seite 1 Quad-Crossfire gegen Quad-SLI: Einleitung und Überblick
- Seite 2 Quad-Crossfire gegen Quad-SLI: Leistungsaufnahme
- Seite 3 Quad-Crossfire gegen Quad-SLI: Mikroruckeln und Input-Lag
- Seite 4 Quad-Crossfire gegen Quad-SLI: Testsystem
- Seite 5 Quad-Crossfire gegen Quad-SLI: Benchmark Crysis Warhead (D3D10)
- Seite 6 Quad-Crossfire gegen Quad-SLI: Benchmark Far Cry 2 (D3D10)
- Seite 7 Quad-Crossfire gegen Quad-SLI: Benchmark Stalker Clear Sky (D3D10)
- Seite 8 Quad-Crossfire gegen Quad-SLI: Fazit

.
Für mich persönlich gibts nach dem Test auch ein relativ klares Fazit:
SLI mit mehr wie 2/3 GPUs bzw. CF mit mehr wie 2/3 GPUs ist momentan absolut sinnfrei, ausser vielleicht für Benchmarkrekordjäger...
Da ich auch in 1680x1050 zocke reicht mir ein SLI aus 2 Grakas locker aus. Werde demnächst meine ollen G80er PCIe1.x Grakas durch 2x280GTX PCIe 2.0 (oder 2x285GTX) ersetzen. Damit kann ich alles mit max.Details + AA/AF locker ruckelfrei geniessen.
Kommt beim nexten Mal "Watt" hinzu. Allerdings wüsste ich nicht, dass man die Leistungsaufnahme mit etwas anderem misst als in Watt
cYa
http://www.pcgameshardware.de/screenshots/original/2009/02/CF_SLI_Power.png
Jaja, deswegen wird ja auch CUDA/Tesla mehr genutzt als FireStream
Ich versuche mal ein paar Gründe zu liefern:
1. Viele Games werden nicht mal für 2 Karten richtig optimiert.
(Die Gruppe der Kunden eines MultiGPU Systems ist nun mal gering)
2. Treiberprobleme: Schon bei der 7950gx2 (erstes mögliche 4 GPU System)
war es schwierig eine optimale Auslastung der Karten bzw. Verwaltung der
Daten zu haben. Je mehr Karten desto schwieriger das Ganze (Skalierung)
Wobei grad der zweite Punkt ausschlaggebend ist. Man kann für die Leistungssteigerung bei der Nutzung von mehreren GPUs, die von CPUs, als Vergleich heranziehen:
1 CPU Kern skaliert zu 100%, 2 Kernen ca. 80% und 4 Kerne (wenn sie genutzt werden) bis etwa 50%-60%. Bei immer mehr Kernen wird es auch schwieriger die Arbeit optimal auf alle verfügbaren Kerne zu verteilen.
Intel hat mit ihrem "Forschungchip (über 200Kerne) berechnet, dass mit bis zu 16 Kernen ein gutes Leistungplus bei einer Steigerung der Kernanzahl erzielt werden kann. Danach immer schlechter.
Ein gutes Beispiel finde ich ist der AMD Phenom X3 (3 Kerne): Hier wird zum Teil eine bessere Leistung erzielt, als mit einem Vierkerner (VSS. nicht extrem auf 4Kerner optimierte Software) bei "Multikern" Software.
Ich denke NV ist mit CUDA einfach einen Schritt schneller, als ATI/AMD gewesen. Zudem bietet CUDA als freiprogrammierbare Schnittstelle schon jetzt ungeahnte Möglichkeit für Software Entwickler. Kein Wunder, dass bevorzugt darauf programmiert wird. Kann sich aber mit DX 11 ändern, wenn ein einheitlicher Standard geschaffen wird.
ps. Biete nicht auf die Werte genau festnageln, kann von Fall zu Fall unterschiedlich sein
mfg