DLSS 3.0: Performance und Fazit

Special 11.10.2022 um 16:06 Uhr Philipp Reuther Als bevorzugte Quelle auf Google hinzufügen

Wie sieht die Leistung von DLSS 3.0 bisher aus und wie lautet das erste Fazit?

In diesem Artikel

DLSS 3.0 - Performance

Generell ist die Optik von DLSS 3.0 sehr beeindruckend. Selbst unter kritischer Beobachtung, wenngleich diese die nicht perfekte Rekonstruktion entlarvt. Doch ist die Bildgüte mit DLSS 3.0 samt Frame Generation dennoch sehr hoch. Insbesondere, wenn auch noch der Performance-Aspekt hinzukommt. Mittels DLSS 3.0 kann sich die Leistung tatsächlich mehr als verdoppeln - gegenüber dem nativ berechneten Bild. Doch auch die Frame Generation bringt in einigen Situationen einen massiven Performance-Zuwachs. Beeindruckend sind speziell die Zugewinne im CPU-Limit, in welches wir etwa in Plague Tale Requiem bereits früh gelangen. Ab knapp über 120 Fps limitiert ohne Frame Generation die Leistung des genutzten Intel Core i9-12900K. Allerdings sorgen solch hohe Bildraten eben auch dafür, dass die optischen wie haptischen Nebenwirkungen von DLSS 3.0 minimiert werden - interessant wird die Beobachtung der Performance und optische Bildgüte demnach vor allem mit den schwächeren Modellen der RTX 4090.

Doch auch dies ist für uns eine Aufgabe in noch kommenden Tagen. Hier die Werte der RTX 4090. Wir ergänzen obendrein einige Frametimes, da diese mit der Frame Generation von DLSS 3.0 deutlich von den anderen Ergebnissen abweichen. Hier können Sie die generierten Frames tatsächlich "sehen". Es sind jene Frametimes, die nach unten abweichen. Interessant: In dem wunderschönen Adventure Plague Tale Requiem (erscheint am 18. Oktober) können Sie DLAA mit der Frame Generation kombinieren, die Performance also durch eingefügte KI-Frames verbessern, ohne das Bild zusätzlich von DLSS heraufrechnen zu lassen. Bei Cyberpunk lässt sich die Frame Generation auch mit DLSS auf Stufe "aus" aktivieren, die Option scheint allerdings aktuell verbuggt zu sein.

DLSS 3.0 - Erstes Fazit

Es ist momentan sehr schwierig, DLSS 3.0 objektiv zu beurteilen. Das liegt an mehreren Umständen. Die Frameraten sind sehr hoch, was die Beobachtung der KI-Frames extrem erschwert. Doch generell ist das Ergebnis beeindruckend und für die mehr oder weniger nahe Zukunft sehr vielversprechend. Doch das ist aktuell ein weiterer kleiner Kritikpunkt: Sämtliche uns zur Verfügung stehende DLSS-3.0-Titel sind noch nicht erschienen beziehungsweise im Fall von Cyberpunk 2077 keine finale Version und lassen etwa Raytracing (Overdrive) vermissen. Gerade bei diesem Anwendungsgebiet ist Nvidias Frame Generation natürlich ausgesprochen hilfreich, man könnte beinahe sagen: Nur mit voller Raytracing-Pracht ist der Einsatz auf der RTX 4090 wirklich sinnvoll. Ein weiterer sehr spannender Punkt ist die Performance im CPU-Limit, wo DLSS 3.0 mit Frame Generation tatsächlich bis zu doppelt so hohe Bildraten erzielen kann - gewissermaßen logischerweise, denn bei der Verdoppelung handelt es sich natürlich um die eingeschobenen KI-Frames, die auf jeden tatsächlich berechneten Frame folgen.

Die restlichen Auswirkungen von DLSS 3.0 mit Frame Generation benötigen aber einen deutlich genaueren, umfangreicheren Blick, als es uns die Zeit und die Test-Situation aktuell einräumen. Das gilt insbesondere auch für die Latenz. In welchem Umfang diese durch die generierten Frames genau beeinflusst wird, werden wir mit weiteren Tests und komplexeren Messverfahren ermitteln müssen. Unsere aktuelle Einschätzung und Beobachtung ist nicht ausreichend und lässt kein schlüssiges, finales Urteil zu. Es ist allerdings allein an den Frametimes ersichtlich, dass es - zumindest in einigen Situationen - eine unruhigere Bildausgabe gibt, mit starken Schwankungen von Frame zu Frame. Allein Letzteres sorgt bereits für eine ebenfalls schwankende und unruhigere Eingabelatenz, im Hinblick auf die generell sehr niedrigen Bildberechnungszeiten sowie hohe Performance ist allerdings fraglich, in welchem Maße. Gleiches gilt auch für die Bildqualität: Sowohl die Bildstabilität und Eingabelatenz wirkt beim Einsatz mit DLSS 3.0 samt Frame Generation instabiler, unruhiger, als DLSS 3.0 auf gleicher Stufe, doch ohne die hinzugefügten KI-Frames. Es ist uns bislang allerdings nicht sonderlich gut gelungen, diese Faktoren in Bild oder Messungen festzuhalten. Wir bemühen uns weiter. Bis daher: Wie ist Ihr Ersteindruck zu DLSS 3.0, Wundertechnik oder fauler KI-Zauber?

Artikel teilen

DLSS 3.0 im ersten Praxis-Test: Wie gut ist Nvidias neues Upsampling mit KI-Frameraten-Boost? Wie sieht die Leistung von DLSS 3.0 bisher aus und wie lautet das erste Fazit?

Per E-Mail versenden

- Kommentare (89)
  Zur Diskussion im Forum
  
  Von DARPA Volt-Modder(in)
  
  Zitat von PCGH_Torsten
  
  Warum nutzen wir eigentlich "Input-Lag" für den Zeitraum von einer Spielereingabe (z.B. Mausbewegung) bis zu deren Darstellung, obwohl es sich um das Warten auf eine Ausgabe handelt?
  
  Lag heisst ja übersetzt (zeitliche) Verzögerung.
  In unserem Fall die Zeit zwischen Eingabe und Verarbeitung+Ausgabe.
  Am Ende ist aber wie so vieles alles nur ne Definitionsfrage.
  
  Und ein Danke für die interessanten Gedanken!
  
  Zitieren
  
  Von DARPA Volt-Modder(in)
  
  Zitat von PCGH_Torsten
  
  Warum nutzen wir eigentlich "Input-Lag" für den Zeitraum von einer Spielereingabe (z.B. Mausbewegung) bis zu deren Darstellung, obwohl es sich um das Warten auf eine Ausgabe handelt?
  
  Lag heisst ja übersetzt (zeitliche) Verzögerung.
  In unserem Fall die Zeit zwischen Eingabe und Verarbeitung+Ausgabe.
  Am Ende ist aber wie so vieles alles nur ne Definitionsfrage.
  
  Und ein Danke für die interessanten Gedanken!
  
  Zitieren
  
  Von WeltbesterGabbyJay Software-Overclocker(in)
  
  Zitat von PCGH_Torsten
  
  Abgesehen davon, dass das eher Phils Testfachgebiet ist
  
  Ah? Dann muss ich Euch verwechselt haben, für mich seht Ihr alle so gleich aus! : D
  
  Man darf dann ja gespannt sein.
  Ich für meinen Teil habs gerne so Lag-frei wie möglich.
  
  Zitieren
  
  Von PCGH_Torsten Kokü-Junkie (m/w)
  
  Nö. Abgesehen davon, dass das eher Phils Testfachgebiet ist, während ich gerade mit Mainboards zugeschmissen werde, haben wir bislang einfach keine Grafikkarte die Frame Generation beherrscht und mit <<60 Fps nativ in einem DLSS-3.0-unterstützenden Spiel läuft. Die Fühlbarkeit dieser Effekte mit einer RXT 4090 zu beurteilen ist kaum möglich. Zwar kann auch die 120 auf 240 Fps interpolieren, aber wer kann single-frame-Unterschiede bei 120 Fps sauber zuordnen?
  
  Wenn erstmal die 4060 da ist un beweisen kann, dass mit FG Cyberpunk 2077 in UHD gut spielbar darstellen kann (oder eben nicht), dann wissen wir hoffentlich mehr. Oder vielleicht kann [Ins Forum, um diesen Inhalt zu sehen] mal tief im Prozessor-Archiv wühlen. Aus der Hüfte geschossen würde ich sagen, dass Frame Generation eigentlich bei CPU-Limitierung genauso gut oder schlecht funktioniert, wie im CPU-Limit und ich glaube CPUs, die Cyberpunk mit 20-30 Fps darstellen, gibt es durchaus.
  
  Zitieren
  
  Von WeltbesterGabbyJay Software-Overclocker(in)
  
  Zitat von PCGH_Torsten
  
  Ich muss meine Einschätzung nochmal korrigieren: Das kürzglich Gesagte gilt nur, wenn man eine 0-Reaktionszeit seitens des Spielers annimmt und der erste Frame einfach schon fertig ist, weil der Redakteur nur den weiteren Verlauf betrachtet. Geht man von einem fortlaufenden Renderloop und einer gewissen Reaktionszeit aus, ändert sich bei Triple-Buffering als Bezugspunkt erstmal wenig – der Input folgt einen Zyklus später auf den Game-Loop (=> Output-Lag knapp vier statt knapp drei Zyklen), aber da die Grafikkarte unter meinen ursprünglichen Annahmen ohnehin einen weiteren Zyklus brauchte, ehe sie die das Bild dazu berechnen konnte, ändert bei der Ausgabe nichts (=> Input-Lag drei statt vier Zyklen).
  
  Bei Double-Buffering dagegen verdoppelt sich der Input-Lag realistischerweise um einen Frame = zwei Zyklen, denn man kann unmöglich während der Anzeige eines Bilds so schnell reagieren, dass die Eingabe schon im folgenden, bereits in Berechnung befindlichen Bild berücksichtigt wird. Und für die Berechnung des ersten Bildes sollte man fairerweise auch zwei Zyklen statt einem einplanen.
  
  Bei DLSS 3.0 hat die Berücksichtigung der Reaktionszeit ähnlich drastische Auswirkungen wie bei Double Buffering: Da die Ausgabe des ersten Frames verzögert erfolgt und wir keine Zauberer sind, kann die Reaktion des Spielers nicht mehr rechtzeitig für den übernächsten Frame erfolgen, sondern erst für den über-übernächsten. Das heißt Frame Generation erzeugt gegenüber Triple-Bffering nicht nur einen weiteren Zyklen mehr Output-Lag, sondern zusätzliche zwei Zyklen Input-Lag gegenüber meiner ursprünglichen Schätzung und somit auch gegenüber Triple-Buffering. Das ist genauso mieß wie der Worst-Case bei Double-Buffering mit einem Drittel der (interpolierten) Framerate. Dazu verschlimmert sich auch noch die Zeit, bis man überhaupt reagieren kann, gegenüber Triple-Buffering genauso stark, wie vom Double-Buffer-Best-Case zu Triple-Buffering.
  
  Im Anhang habe ich das mal mit den benötigten Puffern in der GPU darzustellen versucht.
  
  Anmerkung:
  Die Begriffswahl ist dem gängigen Gebrauch angepasst, der aber irgendwie reichlich bescheuert ist. Warum nutzen wir eigentlich "Input-Lag" für den Zeitraum von einer Spielereingabe (z.B. Mausbewegung) bis zu deren Darstellung, obwohl es sich um das Warten auf eine Ausgabe handelt? Der oben beschrieben Output-Lag wiederum gibt die Zeit an, bis der Spieler endlich eine Eingabe auf ein Ingame-Ereignis tätigt.
  
  Danke für die Erläuterungen, Bruder.
  Konntest Du das auch schon im Praxistest bestätigen?
  
  Zitieren
  
  Von Olstyle Trockeneisprofi (m/w)
  
  Stimmt, Input Lag sind Mausbewegung->USB und DP->Bild. USB -> DP, also das was der PC macht ist eigentlich was Anderes.
  
  Zitieren
  
  Direkt zum Diskussionsende