DLSS 3.0: Performance und Fazit
Wie sieht die Leistung von DLSS 3.0 bisher aus und wie lautet das erste Fazit?
In diesem Artikel
DLSS 3.0 - Performance
Generell ist die Optik von DLSS 3.0 sehr beeindruckend. Selbst unter kritischer Beobachtung, wenngleich diese die nicht perfekte Rekonstruktion entlarvt. Doch ist die Bildgüte mit DLSS 3.0 samt Frame Generation dennoch sehr hoch. Insbesondere, wenn auch noch der Performance-Aspekt hinzukommt. Mittels DLSS 3.0 kann sich die Leistung tatsächlich mehr als verdoppeln - gegenüber dem nativ berechneten Bild. Doch auch die Frame Generation bringt in einigen Situationen einen massiven Performance-Zuwachs. Beeindruckend sind speziell die Zugewinne im CPU-Limit, in welches wir etwa in Plague Tale Requiem bereits früh gelangen. Ab knapp über 120 Fps limitiert ohne Frame Generation die Leistung des genutzten Intel Core i9-12900K. Allerdings sorgen solch hohe Bildraten eben auch dafür, dass die optischen wie haptischen Nebenwirkungen von DLSS 3.0 minimiert werden - interessant wird die Beobachtung der Performance und optische Bildgüte demnach vor allem mit den schwächeren Modellen der RTX 4090.
Doch auch dies ist für uns eine Aufgabe in noch kommenden Tagen. Hier die Werte der RTX 4090. Wir ergänzen obendrein einige Frametimes, da diese mit der Frame Generation von DLSS 3.0 deutlich von den anderen Ergebnissen abweichen. Hier können Sie die generierten Frames tatsächlich "sehen". Es sind jene Frametimes, die nach unten abweichen. Interessant: In dem wunderschönen Adventure Plague Tale Requiem (erscheint am 18. Oktober) können Sie DLAA mit der Frame Generation kombinieren, die Performance also durch eingefügte KI-Frames verbessern, ohne das Bild zusätzlich von DLSS heraufrechnen zu lassen. Bei Cyberpunk lässt sich die Frame Generation auch mit DLSS auf Stufe "aus" aktivieren, die Option scheint allerdings aktuell verbuggt zu sein.
DLSS 3.0 - Erstes Fazit
Es ist momentan sehr schwierig, DLSS 3.0 objektiv zu beurteilen. Das liegt an mehreren Umständen. Die Frameraten sind sehr hoch, was die Beobachtung der KI-Frames extrem erschwert. Doch generell ist das Ergebnis beeindruckend und für die mehr oder weniger nahe Zukunft sehr vielversprechend. Doch das ist aktuell ein weiterer kleiner Kritikpunkt: Sämtliche uns zur Verfügung stehende DLSS-3.0-Titel sind noch nicht erschienen beziehungsweise im Fall von Cyberpunk 2077 keine finale Version und lassen etwa Raytracing (Overdrive) vermissen. Gerade bei diesem Anwendungsgebiet ist Nvidias Frame Generation natürlich ausgesprochen hilfreich, man könnte beinahe sagen: Nur mit voller Raytracing-Pracht ist der Einsatz auf der RTX 4090 wirklich sinnvoll. Ein weiterer sehr spannender Punkt ist die Performance im CPU-Limit, wo DLSS 3.0 mit Frame Generation tatsächlich bis zu doppelt so hohe Bildraten erzielen kann - gewissermaßen logischerweise, denn bei der Verdoppelung handelt es sich natürlich um die eingeschobenen KI-Frames, die auf jeden tatsächlich berechneten Frame folgen.
Die restlichen Auswirkungen von DLSS 3.0 mit Frame Generation benötigen aber einen deutlich genaueren, umfangreicheren Blick, als es uns die Zeit und die Test-Situation aktuell einräumen. Das gilt insbesondere auch für die Latenz. In welchem Umfang diese durch die generierten Frames genau beeinflusst wird, werden wir mit weiteren Tests und komplexeren Messverfahren ermitteln müssen. Unsere aktuelle Einschätzung und Beobachtung ist nicht ausreichend und lässt kein schlüssiges, finales Urteil zu. Es ist allerdings allein an den Frametimes ersichtlich, dass es - zumindest in einigen Situationen - eine unruhigere Bildausgabe gibt, mit starken Schwankungen von Frame zu Frame. Allein Letzteres sorgt bereits für eine ebenfalls schwankende und unruhigere Eingabelatenz, im Hinblick auf die generell sehr niedrigen Bildberechnungszeiten sowie hohe Performance ist allerdings fraglich, in welchem Maße. Gleiches gilt auch für die Bildqualität: Sowohl die Bildstabilität und Eingabelatenz wirkt beim Einsatz mit DLSS 3.0 samt Frame Generation instabiler, unruhiger, als DLSS 3.0 auf gleicher Stufe, doch ohne die hinzugefügten KI-Frames. Es ist uns bislang allerdings nicht sonderlich gut gelungen, diese Faktoren in Bild oder Messungen festzuhalten. Wir bemühen uns weiter. Bis daher: Wie ist Ihr Ersteindruck zu DLSS 3.0, Wundertechnik oder fauler KI-Zauber?

In unserem Fall die Zeit zwischen Eingabe und Verarbeitung+Ausgabe.
Am Ende ist aber wie so vieles alles nur ne Definitionsfrage.
Und ein Danke für die interessanten Gedanken!
Man darf dann ja gespannt sein.
Ich für meinen Teil habs gerne so Lag-frei wie möglich.
Wenn erstmal die 4060 da ist un beweisen kann, dass mit FG Cyberpunk 2077 in UHD gut spielbar darstellen kann (oder eben nicht), dann wissen wir hoffentlich mehr. Oder vielleicht kann [Ins Forum, um diesen Inhalt zu sehen] mal tief im Prozessor-Archiv wühlen. Aus der Hüfte geschossen würde ich sagen, dass Frame Generation eigentlich bei CPU-Limitierung genauso gut oder schlecht funktioniert, wie im CPU-Limit und ich glaube CPUs, die Cyberpunk mit 20-30 Fps darstellen, gibt es durchaus.
Bei Double-Buffering dagegen verdoppelt sich der Input-Lag realistischerweise um einen Frame = zwei Zyklen, denn man kann unmöglich während der Anzeige eines Bilds so schnell reagieren, dass die Eingabe schon im folgenden, bereits in Berechnung befindlichen Bild berücksichtigt wird. Und für die Berechnung des ersten Bildes sollte man fairerweise auch zwei Zyklen statt einem einplanen.
Bei DLSS 3.0 hat die Berücksichtigung der Reaktionszeit ähnlich drastische Auswirkungen wie bei Double Buffering: Da die Ausgabe des ersten Frames verzögert erfolgt und wir keine Zauberer sind, kann die Reaktion des Spielers nicht mehr rechtzeitig für den übernächsten Frame erfolgen, sondern erst für den über-übernächsten. Das heißt Frame Generation erzeugt gegenüber Triple-Bffering nicht nur einen weiteren Zyklen mehr Output-Lag, sondern zusätzliche zwei Zyklen Input-Lag gegenüber meiner ursprünglichen Schätzung und somit auch gegenüber Triple-Buffering. Das ist genauso mieß wie der Worst-Case bei Double-Buffering mit einem Drittel der (interpolierten) Framerate. Dazu verschlimmert sich auch noch die Zeit, bis man überhaupt reagieren kann, gegenüber Triple-Buffering genauso stark, wie vom Double-Buffer-Best-Case zu Triple-Buffering.
Im Anhang habe ich das mal mit den benötigten Puffern in der GPU darzustellen versucht.
Anmerkung:
Die Begriffswahl ist dem gängigen Gebrauch angepasst, der aber irgendwie reichlich bescheuert ist. Warum nutzen wir eigentlich "Input-Lag" für den Zeitraum von einer Spielereingabe (z.B. Mausbewegung) bis zu deren Darstellung, obwohl es sich um das Warten auf eine Ausgabe handelt? Der oben beschrieben Output-Lag wiederum gibt die Zeit an, bis der Spieler endlich eine Eingabe auf ein Ingame-Ereignis tätigt.
Konntest Du das auch schon im Praxistest bestätigen?