DLSS 4 im Test: Cyberpunk mit MFG
In diesem Artikel
Genug zu KI-Modellen, der letzten GPU-Generation und alten DLSS-Versionen. Was kann denn nun die RTX 5090 und die Multi-Frame-Generation "MFG"? Schließlich ist das Blackwell-exklusive DLSS 4 das Gaming-Zugpferd der neuen Nvidia-Generation. Zumindest bis die vielen neuen Features um Neutral Rendering bzw. Neural Shading in Spiele einzieht, wozu obendrein eine entsprechende API nötig wird, die im Falle von DirectX bisher nicht einmal erhältlich ist. Wie schlägt sich also DLSS 4 und wie wirkt sich die Multi-Frame-Generation auf die Eingabe-Latenzen aus?
DLSS 4 mit großen Fps-Zuwächsen
Zum Testen erwählen wir Cyberpunk 2077 - natürlich mit Pathtracing, schließlich kommt hier mit der RTX 5090 das neue Nvidia-Flaggschiff zum Einsatz und will gebührend gefordert werden. Da bei entsprechenden Nvidia-Folien Benchmarks und "Pixelrechnungen" im Regelfall DLSS Performance als Ausgangsbasis genutzt wird, wählen wir ebenfalls diese DLSS-Stufe. So können wir die von Nvidia zur Ankündigung der RTX 5090 veröffentlichten Performance-Daten auf die Probe stellen. Hat Nvidia zu viel versprochen?
Kurz: Nein. Wir können die Performance-Zuwächse bestätigen und in einigen Fällen gar die von Nvidia veröffentlichten Prozentzuwächse schlagen. Wir nutzten für die Benchmarks unsere bekannte GPU-Benchmark-Szene, die beim Einsatz von Ray- und Pathtracing besonders anspruchsvoll ausfällt. Die Szene sehen Sie hier im Video.
Für die Latenzmessungen setzten wir auf LDAT und End-to-End-Latenzen. Diese entsprechen der vollen Latenz, die durch die Berechnung des Bildes, die (Multi) Frame Generation, dem Frame-Pacing sowie der Monitor-Ausgabe besteht. Es ist jene Latenz, die Sie tatsächlich beim Spielen erleben. Für diese Messungen nutzen wir eine abweichende Szene, da wir eine dunkle Umgebung zum Hervorheben des Mündungsfeuers als Auslöser für das LDAT-Mess-Tool benötigen. Obendrein darf die Performance in dieser Szene nicht über Gebühr schwanken, weshalb wir Verkehr und NPCs meiden. Letzteres verhindert außerdem, dass wir beim Entleeren unseres Magazins mit aufgescheuchten Nichtspieler-Charakteren Probleme bekommen oder von umherlaufenden Polizisten erschossen werden.
Dabei unterscheidet sich natürlich auch die Performance von der GPU-Testszene. Da die Grund-Performance, die Renderlatenz, ebenfalls Auswirkungen auf die End-to-End-Latenz und die Eingabe haben, geben wir die Performance-Daten während des Messzeitraums ebenfalls an. Im rauen Umland von Night City liegen die Bildraten trotz Pathtracing deutlich höher. Die Latenzmessungen bestehen jeweils aus drei Durchläufen mit je 30 Messungen, die Latenzangaben spiegeln demnach den Durchschnitt von 90 Einzelmessungen ab.
Hochfrequentes Display erwünscht
Wie Sie eventuell sehen, haben wir obendrein mit einem schnell taktenden Display gearbeitet. Die Refresh-Rate kann sehr deutliche Auswirkungen auf die End-to-End-Latenzen haben, wenn eine Bildsynchronisation - insbesondere Vsync - zum Einsatz kommt. Vsync ist bei unseren aktuellen Messungen deaktiviert, genauer gesagt steht in der Nvidia-App auf "Einstellung für 3D-Anwendungen verwenden". In Cyberpunk 2077 selbst ist Vsync im Optionsmenü deaktiviert, wenn Sie die Frame Gen zuschalten, graut sich der Eintrag zudem aus; es kommt demnach kein Vsync zum Einsatz, Gsync Compatible beziehungsweise Adaptive Sync ist bei unserem Monitor ebenfalls deaktiviert. Das Frame-Pacing, also die Ausgabe von voll berechneten und generierten, interpolierten Frames durch die Frame Gen, wird indes ebenfalls von der Refresh-Rate beeinflusst. Passend zum Release der RTX 5090 und DLSS 4 schwärmt aktuell auch Nvidia von neuen, extrem geschwinden Monitoren.
Optimalerweise hätten wir allerdings einen 4K-500-Hz-Monitor zum Testen genutzt; es fehlt schlicht ein passendes Testgerät - inklusive passender Anschlüsse und passender Kabel. Auf die gemessene End-to-End-Latenz hat die Refreshrate in diesem Test jedoch einen nur geringen Einfluss. Dies würde sich allerdings gravierend ändern, falls eine Bildsynchronisation wie Vsync zum Einsatz käme. Eine solche würde die Eingabe-Latenz bei niedrig taktenden Monitoren massiv erhöhen, da auf den passenden Refresh gewartet werden muss. Bei 60 Hertz schlimmstenfalls volle 16,7 ms; mit Triple Buffering wird gar noch ein zusätzlicher Frame "geparkt", was abermals die Latenz erhöht.
Quelle: PCGH
Der für die Tests genutzte Asus-Monitor PG27AQDP lässt sich mit Custom-Resolution in 4K mit 120 Hz betreiben - immerhin. Mehr ist allerdings besser. In WQHD bietet das Display gar 480 Hertz. Für den Einsatz einer Multi Frame Generation und hohen, dreistelligen Bildraten ist solch ein hoch taktendes Display beinahe schon Voraussetzung.
Dies können Sie unserem 480-Hertz-Test entnehmen [PLUS-Artikel], dort testen wir auch den hier eingesetzten Asus-Monitor (mit Custom-Resolution sind auf diesem maximal 120 Hertz in 4K-Auflösung möglich). Um es ganz deutlich auszudrücken: Für DLSS 4 benötigen Sie ein hoch taktendes Display. Ansonsten können Sie die Vorzüge der Multi-Frame-Generation nicht adäquat ausnutzen. 120/144 Hz sind Pflicht, doch im Grunde bräuchten Sie ein 480-Hertz- oder gar nochmals flinker taktendes Display. Je höher die Refresh-Rate, desto besser, desto sauberer ist die FG, desto geringer sind die Latenzen bei Nutzen einer Bildsynchronisation.
Behäbiges Cyberpunk
Sie können unseren Latenzmessungen außerdem entnehmen, dass es sich bei Cyberpunk 2077 trotz Ego-Perspektive um keinen Twitch-Shooter handelt. Das Spielgefühl an der Maus ist generell behäbig; wenn Sie einmal Cyberpunk 2077 nach dem Spielen eines Call-of-Dutys gestartet haben, wissen Sie eventuell, was wir meinen. Ein Call of Duty wirkt im Vergleich hyperdirekt, super-geschwind und beinahe schon zappelig. Im aktuellen Call of Duty messen wir mit Bildraten knapp über 200 Fps eine E2E-Latenz von unter 25 ms beim Einsatz eines 480-Hz-Displays (wir verweisen abermals auf unseren Plus-Artikel).
Während wir in Cyberpunk samt Pathtracing trotz RTX 5090 unter dem Einsatz von DLSS Performance und in WQHD-Auflösung "nur" bei knapp 100 Fps landen, messen wir bei den E2E-Latenzen in Cyberpunk 2077 rund 120 ms. Dies kommt natürlich auch DLSS 4 und der MFG zugute, denn ein Call of Duty wäre viel sensibler für Latenz-Erhöhungen im einstelligen oder gering zweistelligen Millisekunden-Bereich. Bei Cyberpunk und über 100 ms Eingabe-Latenz spielt es dagegen kaum eine Rolle. Und wir können subjektiv bestätigen, dass sich DLSS 4 mit MFG und Reflex 2 kaum bedeutsam langsamer anfühlt, als mit DLSS-4-Upsampling, aber ohne Frame Generation und Reflex 2.
Das Ergebnis kann sich sehen lassen und spiegelt obendrein jene MFG-Werte wider, die wir uns nach den technischen Abhandlungen auf dem Editor's Day erwünscht und erhofft haben: Das eigentliche Generieren der KI-Frames ist sehr geschwind. Der Großteil der FG-Latenz wird durch das Zurückhalten der voll berechneten Bilder verursacht, aus denen darauf das Bild (mit bisheriger FG) oder die Zwischenbilder (mit MFG bis zu drei aufeinanderfolgend) interpoliert werden. Erst darauf werden die Bilder der Reihe und mittels Frame-Pacing in regelmäßiger Staffelung nach und nach ausgegeben.
Das KI-unterstützte Generieren der KI-Zwischenbilder geht allerdings sehr geschwind vonstatten, insbesondere bei DLSS 4. Es ist anhand der sehr guten Skalierung obendrein offenkundig, dass die KI-Frames der Blackwell-Generation wesentlich schneller erzeugt werden können, als jene 3 ms, die Nvidia damals für DLSS 3 nannte. 3 ms entsprechen rund 333 Fps. DLSS 3 stagniert bei Bildraten um 250 Fps, dann nämlich, wenn sich die Zeit, die für die Interpolation des KI-Frames anfällt, jener Zeit annähert, welche die volle Berechnung eines "echten" Frames in Anspruch nimmt. Mit DLSS 3 sind Bildraten jenseits der 300 Fps daher nahezu unmöglich. Die 3 ms, welche das Generieren des DLSS-3-Zwischenbildes benötigen, bremsen das Geschehen aus. Mit DLSS 4 ist dies nicht der Fall, es beschleunigt selbst ausgehend von bereits sehr hohen Bildraten nochmals. Bravo!
Allerdings hat die Monitor-Refreshrate auch ohne Bildsynchronisation einen teils gravierenden Einfluss auf die Bildqualität, im Falle von Multi-Frame-Generation gar besonders. Je länger ein Refresh in Anspruch nimmt, desto länger sind die KI-Frames auf dem Bildschirm sichtbar. Und im Falle der MFG sind es bis zu drei KI-Frames hintereinander. Aktuell lassen sich diese KI-Frames deutlich erkennen, sie zeigen recht grobe Artefakte. Bei 4K und 120 Hertz sind diese für ein geschultes Auge auch bei dreistelligen Bildraten klar zu erkennen, es kommt zu rissartigen Artefakten, die uns auch bei den ersten Tests zu Nvidias DLSS 3 sofort auffielen.
Das geschulte Auge sieht Artefakte
Mit DLSS 4 sind wir nun offenbar wieder an einem ähnlichen Punkt angekommen: Die KI ist noch "jung" und hat bislang nicht genügend trainieren können, um deutliche Artefakte beim Generieren der Zwischenbilder zu vermeiden. Bei DLSS 3 besserte sich dieser Umstand nach relativ kurzer Zeit. Wird dies auch bei DLSS 4 der Fall sein? Vermutlich, doch an dieser Stelle müssen wir auf weitere Tests zu einem späteren Zeitpunkt verweisen.
Dann hoffentlich außerdem mit einer ganzen Reihe von geeigneten DLSS-4-Spielen, denn die vor dem eigentlichen Launch der RTX 5090 und DLSS 4 zur Verfügung stehende Auswahl ist doch etwas eingeschränkt - und zudem nicht vollständig final, siehe fehlende Legacy-Modi etc. Während unserer Tests kam es obendrein mehrfach zu Aussetzern beim Frame-Pacing, offenbar ausgelöst durch Task-Switches, durch Videoaufnahmen sowie Wechseln von Borderless- auf Fullscreen-Darstellung. Diese Frame-Pacing-Probleme zeigten sich sowohl in Cyberpunk 2077 als auch im 3D-Mark mit DLSS 4 und auf einem anderen Testsystem. Ansonsten blieben wir allerdings von groben Fehlern oder Abstürzen verschont.
Generell hat Nvidias DLSS 4 mit Multi-Frame-Generation einen erfreulich guten Ersteindruck hinterlassen. Auch, wenn es ähnlich wie damals bei DLSS 3 noch zu einigen Artefakten, Bildinterpolationsfehlern und KI-Aussetzern kommt und unser Testredakteur die generierten Frames der Multi Frame Generation klar erkennen kann. Insbesondere in 4K und bei "nur" 120 Hertz sind 2 oder gar 3 aufeinanderfolgende KI-Frames für ein geschultes Auge kaum zu übersehen. Der Input-Lag hält sich dagegen erfreulich in Grenzen, zumindest in dem generell recht trägen Cyberpunk und ohne zusätzliche Komplikationen durch eine Bildsynchronisation wie Vsync. Doch für das Erste müssen wir mit unseren DLSS-4-Tests zum Ende kommen. Sie dürfen sich jedoch in Kürze auf neue, tiefere Einblicke in DLSS 4 und die Multi Frame Generation freuen, dann auch mit weiteren RTX-Grafikkarten.
Ihre Meinung ist gefragt!
Was halten Sie von DLSS 4? Nutzen Sie die Kommentarfunktion und teilen Sie uns Ihre Meinung mit. Beachten Sie beim Kommentieren aber bitte die Forenregeln. Folgen Sie uns außerdem für Neuigkeiten in der Hardware-Welt oder unsere exklusiven Inhalte gern auf Whatsapp und X. Unsere Video-Inhalte (oftmals gewürzt mit einer Prise Humor) finden Sie bei Youtube, Instagram und Tiktok.

Konkret: Ich setzte diese Limitierung für einen 240 Hz-Monitor auf maximal 240 FPS und schalte MFG x2 hinzu - entsprechend erhalte ich ~80 native FPS und ergänzend ~160 generierte FPS.
Man erhält also eine Smoothness, die durch Grafikkarte und Monitor ermöglicht wird, reduziert jedoch die Auslastung der Grafikkarte. Das wäre ja schon ziemlich stark, wenn die Artefakte dann mal weitgehend abtrainiert sind.
Preisfrage also: Wie viel Strom würde man dabei ungefähr sparen?
240 nativ
120 nativ / 120 generiert
80 nativ / 160 generiert
60 nativ / 180 generiert
(Vermutlich kann das vorerst kaum jemand außer [Ins Forum, um diesen Inhalt zu sehen] oder [Ins Forum, um diesen Inhalt zu sehen] beantworten ...?)
Spare ich mit 80 nativ/160 MFG gegenüber 240 nativ Strom?
Was meines Wissens nach nicht geht, ist gezielt nativen Frames zu begrenzen. FPS-Limiter begrenzen nur die ausgegeben Menge an Bildern. Soll heißen, wenn Du auf 80 FPS begrenzt und dann FG zuschaltest, hast Du 80 FPS inclusive der generierten Frames, nicht zusätzlich.
Gsync Compatible beziehungsweise Adaptive Sync ist bei unserem Monitor ebenfalls deaktiviert. Das Frame-Pacing, also die Ausgabe von voll berechneten und generierten, interpolierten Frames durch die Frame Gen, wird indes ebenfalls von der Refresh-Rate beeinflusst.
Außerdem noch eine Frage zum Stromverbrauch. Angenommen, man spielt ein etwas älteres, nicht ganz so anspruchvolles Spiel, dass mit deutlich mehr als 100 nativen FPS dargestellt werden kann. Treiberseitig kann ich die FPS bspw. "chillen", somit auf native 100 FPS deckeln, wodurch auch die Belastung der Grafikkarte und resultierend die Lautstärke und der Stromverbrauch reduziert werden.
Wie verhält sich das nun mit MFG? Kann ich die nativen Frames auf 80 FPS festsetzen, um 240 FPS via MFG zu erhalten?
Spare ich mit 80 nativ/160 MFG gegenüber 240 nativ Strom?
laut dem video oben minimum 70fps
Meine es hängt so stark am Spiel. Bei einem Alan Wake reichen mir auch unter 50Fps, in der Basis noch.
Bei einem schnellen Shooter eher über 80, oder 90 in der Basis.