DLSS 4 im Test: Cyberpunk mit MFG

Special 23.01.2025 um 15:00 Uhr Philipp Reuther Als bevorzugte Quelle auf Google hinzufügen

In diesem Artikel

Genug zu KI-Modellen, der letzten GPU-Generation und alten DLSS-Versionen. Was kann denn nun die RTX 5090 und die Multi-Frame-Generation "MFG"? Schließlich ist das Blackwell-exklusive DLSS 4 das Gaming-Zugpferd der neuen Nvidia-Generation. Zumindest bis die vielen neuen Features um Neutral Rendering bzw. Neural Shading in Spiele einzieht, wozu obendrein eine entsprechende API nötig wird, die im Falle von DirectX bisher nicht einmal erhältlich ist. Wie schlägt sich also DLSS 4 und wie wirkt sich die Multi-Frame-Generation auf die Eingabe-Latenzen aus?

DLSS 4 mit großen Fps-Zuwächsen

Zum Testen erwählen wir Cyberpunk 2077 - natürlich mit Pathtracing, schließlich kommt hier mit der RTX 5090 das neue Nvidia-Flaggschiff zum Einsatz und will gebührend gefordert werden. Da bei entsprechenden Nvidia-Folien Benchmarks und "Pixelrechnungen" im Regelfall DLSS Performance als Ausgangsbasis genutzt wird, wählen wir ebenfalls diese DLSS-Stufe. So können wir die von Nvidia zur Ankündigung der RTX 5090 veröffentlichten Performance-Daten auf die Probe stellen. Hat Nvidia zu viel versprochen?

Kurz: Nein. Wir können die Performance-Zuwächse bestätigen und in einigen Fällen gar die von Nvidia veröffentlichten Prozentzuwächse schlagen. Wir nutzten für die Benchmarks unsere bekannte GPU-Benchmark-Szene, die beim Einsatz von Ray- und Pathtracing besonders anspruchsvoll ausfällt. Die Szene sehen Sie hier im Video.

Empfohlener redaktioneller Inhalt [EMBED_URL] An dieser Stelle finden Sie externe Inhalte von [PLATTFORM]. Zum Schutz Ihrer persönlichen Daten werden externe Einbindungen erst angezeigt, wenn Sie dies durch Klick auf "Alle externen Inhalte laden" bestätigen: Ich bin damit einverstanden, dass mir externe Inhalte angezeigt werden. Damit werden personenbezogene Daten an Drittplattformen übermittelt. Mehr dazu in unserer Datenschutzerklärung.

Externe Inhalte Mehr dazu in unserer Datenschutzerklärung.

Für die Latenzmessungen setzten wir auf LDAT und End-to-End-Latenzen. Diese entsprechen der vollen Latenz, die durch die Berechnung des Bildes, die (Multi) Frame Generation, dem Frame-Pacing sowie der Monitor-Ausgabe besteht. Es ist jene Latenz, die Sie tatsächlich beim Spielen erleben. Für diese Messungen nutzen wir eine abweichende Szene, da wir eine dunkle Umgebung zum Hervorheben des Mündungsfeuers als Auslöser für das LDAT-Mess-Tool benötigen. Obendrein darf die Performance in dieser Szene nicht über Gebühr schwanken, weshalb wir Verkehr und NPCs meiden. Letzteres verhindert außerdem, dass wir beim Entleeren unseres Magazins mit aufgescheuchten Nichtspieler-Charakteren Probleme bekommen oder von umherlaufenden Polizisten erschossen werden.

Dabei unterscheidet sich natürlich auch die Performance von der GPU-Testszene. Da die Grund-Performance, die Renderlatenz, ebenfalls Auswirkungen auf die End-to-End-Latenz und die Eingabe haben, geben wir die Performance-Daten während des Messzeitraums ebenfalls an. Im rauen Umland von Night City liegen die Bildraten trotz Pathtracing deutlich höher. Die Latenzmessungen bestehen jeweils aus drei Durchläufen mit je 30 Messungen, die Latenzangaben spiegeln demnach den Durchschnitt von 90 Einzelmessungen ab.

Hochfrequentes Display erwünscht

Wie Sie eventuell sehen, haben wir obendrein mit einem schnell taktenden Display gearbeitet. Die Refresh-Rate kann sehr deutliche Auswirkungen auf die End-to-End-Latenzen haben, wenn eine Bildsynchronisation - insbesondere Vsync - zum Einsatz kommt. Vsync ist bei unseren aktuellen Messungen deaktiviert, genauer gesagt steht in der Nvidia-App auf "Einstellung für 3D-Anwendungen verwenden". In Cyberpunk 2077 selbst ist Vsync im Optionsmenü deaktiviert, wenn Sie die Frame Gen zuschalten, graut sich der Eintrag zudem aus; es kommt demnach kein Vsync zum Einsatz, Gsync Compatible beziehungsweise Adaptive Sync ist bei unserem Monitor ebenfalls deaktiviert. Das Frame-Pacing, also die Ausgabe von voll berechneten und generierten, interpolierten Frames durch die Frame Gen, wird indes ebenfalls von der Refresh-Rate beeinflusst. Passend zum Release der RTX 5090 und DLSS 4 schwärmt aktuell auch Nvidia von neuen, extrem geschwinden Monitoren.

Externe Inhalte Mehr dazu in unserer Datenschutzerklärung.

Optimalerweise hätten wir allerdings einen 4K-500-Hz-Monitor zum Testen genutzt; es fehlt schlicht ein passendes Testgerät - inklusive passender Anschlüsse und passender Kabel. Auf die gemessene End-to-End-Latenz hat die Refreshrate in diesem Test jedoch einen nur geringen Einfluss. Dies würde sich allerdings gravierend ändern, falls eine Bildsynchronisation wie Vsync zum Einsatz käme. Eine solche würde die Eingabe-Latenz bei niedrig taktenden Monitoren massiv erhöhen, da auf den passenden Refresh gewartet werden muss. Bei 60 Hertz schlimmstenfalls volle 16,7 ms; mit Triple Buffering wird gar noch ein zusätzlicher Frame "geparkt", was abermals die Latenz erhöht.

Quelle: PCGH Der für die Tests genutzte Asus-Monitor PG27AQDP lässt sich mit Custom-Resolution in 4K mit 120 Hz betreiben - immerhin. Mehr ist allerdings besser. In WQHD bietet das Display gar 480 Hertz. Für den Einsatz einer Multi Frame Generation und hohen, dreistelligen Bildraten ist solch ein hoch taktendes Display beinahe schon Voraussetzung. Dies können Sie unserem 480-Hertz-Test entnehmen [PLUS-Artikel], dort testen wir auch den hier eingesetzten Asus-Monitor (mit Custom-Resolution sind auf diesem maximal 120 Hertz in 4K-Auflösung möglich). Um es ganz deutlich auszudrücken: Für DLSS 4 benötigen Sie ein hoch taktendes Display. Ansonsten können Sie die Vorzüge der Multi-Frame-Generation nicht adäquat ausnutzen. 120/144 Hz sind Pflicht, doch im Grunde bräuchten Sie ein 480-Hertz- oder gar nochmals flinker taktendes Display. Je höher die Refresh-Rate, desto besser, desto sauberer ist die FG, desto geringer sind die Latenzen bei Nutzen einer Bildsynchronisation.

Behäbiges Cyberpunk

Sie können unseren Latenzmessungen außerdem entnehmen, dass es sich bei Cyberpunk 2077 trotz Ego-Perspektive um keinen Twitch-Shooter handelt. Das Spielgefühl an der Maus ist generell behäbig; wenn Sie einmal Cyberpunk 2077 nach dem Spielen eines Call-of-Dutys gestartet haben, wissen Sie eventuell, was wir meinen. Ein Call of Duty wirkt im Vergleich hyperdirekt, super-geschwind und beinahe schon zappelig. Im aktuellen Call of Duty messen wir mit Bildraten knapp über 200 Fps eine E2E-Latenz von unter 25 ms beim Einsatz eines 480-Hz-Displays (wir verweisen abermals auf unseren Plus-Artikel).

Während wir in Cyberpunk samt Pathtracing trotz RTX 5090 unter dem Einsatz von DLSS Performance und in WQHD-Auflösung "nur" bei knapp 100 Fps landen, messen wir bei den E2E-Latenzen in Cyberpunk 2077 rund 120 ms. Dies kommt natürlich auch DLSS 4 und der MFG zugute, denn ein Call of Duty wäre viel sensibler für Latenz-Erhöhungen im einstelligen oder gering zweistelligen Millisekunden-Bereich. Bei Cyberpunk und über 100 ms Eingabe-Latenz spielt es dagegen kaum eine Rolle. Und wir können subjektiv bestätigen, dass sich DLSS 4 mit MFG und Reflex 2 kaum bedeutsam langsamer anfühlt, als mit DLSS-4-Upsampling, aber ohne Frame Generation und Reflex 2.

Das Ergebnis kann sich sehen lassen und spiegelt obendrein jene MFG-Werte wider, die wir uns nach den technischen Abhandlungen auf dem Editor's Day erwünscht und erhofft haben: Das eigentliche Generieren der KI-Frames ist sehr geschwind. Der Großteil der FG-Latenz wird durch das Zurückhalten der voll berechneten Bilder verursacht, aus denen darauf das Bild (mit bisheriger FG) oder die Zwischenbilder (mit MFG bis zu drei aufeinanderfolgend) interpoliert werden. Erst darauf werden die Bilder der Reihe und mittels Frame-Pacing in regelmäßiger Staffelung nach und nach ausgegeben.

Das KI-unterstützte Generieren der KI-Zwischenbilder geht allerdings sehr geschwind vonstatten, insbesondere bei DLSS 4. Es ist anhand der sehr guten Skalierung obendrein offenkundig, dass die KI-Frames der Blackwell-Generation wesentlich schneller erzeugt werden können, als jene 3 ms, die Nvidia damals für DLSS 3 nannte. 3 ms entsprechen rund 333 Fps. DLSS 3 stagniert bei Bildraten um 250 Fps, dann nämlich, wenn sich die Zeit, die für die Interpolation des KI-Frames anfällt, jener Zeit annähert, welche die volle Berechnung eines "echten" Frames in Anspruch nimmt. Mit DLSS 3 sind Bildraten jenseits der 300 Fps daher nahezu unmöglich. Die 3 ms, welche das Generieren des DLSS-3-Zwischenbildes benötigen, bremsen das Geschehen aus. Mit DLSS 4 ist dies nicht der Fall, es beschleunigt selbst ausgehend von bereits sehr hohen Bildraten nochmals. Bravo!

Allerdings hat die Monitor-Refreshrate auch ohne Bildsynchronisation einen teils gravierenden Einfluss auf die Bildqualität, im Falle von Multi-Frame-Generation gar besonders. Je länger ein Refresh in Anspruch nimmt, desto länger sind die KI-Frames auf dem Bildschirm sichtbar. Und im Falle der MFG sind es bis zu drei KI-Frames hintereinander. Aktuell lassen sich diese KI-Frames deutlich erkennen, sie zeigen recht grobe Artefakte. Bei 4K und 120 Hertz sind diese für ein geschultes Auge auch bei dreistelligen Bildraten klar zu erkennen, es kommt zu rissartigen Artefakten, die uns auch bei den ersten Tests zu Nvidias DLSS 3 sofort auffielen.

Das geschulte Auge sieht Artefakte

Mit DLSS 4 sind wir nun offenbar wieder an einem ähnlichen Punkt angekommen: Die KI ist noch "jung" und hat bislang nicht genügend trainieren können, um deutliche Artefakte beim Generieren der Zwischenbilder zu vermeiden. Bei DLSS 3 besserte sich dieser Umstand nach relativ kurzer Zeit. Wird dies auch bei DLSS 4 der Fall sein? Vermutlich, doch an dieser Stelle müssen wir auf weitere Tests zu einem späteren Zeitpunkt verweisen.

Dann hoffentlich außerdem mit einer ganzen Reihe von geeigneten DLSS-4-Spielen, denn die vor dem eigentlichen Launch der RTX 5090 und DLSS 4 zur Verfügung stehende Auswahl ist doch etwas eingeschränkt - und zudem nicht vollständig final, siehe fehlende Legacy-Modi etc. Während unserer Tests kam es obendrein mehrfach zu Aussetzern beim Frame-Pacing, offenbar ausgelöst durch Task-Switches, durch Videoaufnahmen sowie Wechseln von Borderless- auf Fullscreen-Darstellung. Diese Frame-Pacing-Probleme zeigten sich sowohl in Cyberpunk 2077 als auch im 3D-Mark mit DLSS 4 und auf einem anderen Testsystem. Ansonsten blieben wir allerdings von groben Fehlern oder Abstürzen verschont.

Generell hat Nvidias DLSS 4 mit Multi-Frame-Generation einen erfreulich guten Ersteindruck hinterlassen. Auch, wenn es ähnlich wie damals bei DLSS 3 noch zu einigen Artefakten, Bildinterpolationsfehlern und KI-Aussetzern kommt und unser Testredakteur die generierten Frames der Multi Frame Generation klar erkennen kann. Insbesondere in 4K und bei "nur" 120 Hertz sind 2 oder gar 3 aufeinanderfolgende KI-Frames für ein geschultes Auge kaum zu übersehen. Der Input-Lag hält sich dagegen erfreulich in Grenzen, zumindest in dem generell recht trägen Cyberpunk und ohne zusätzliche Komplikationen durch eine Bildsynchronisation wie Vsync. Doch für das Erste müssen wir mit unseren DLSS-4-Tests zum Ende kommen. Sie dürfen sich jedoch in Kürze auf neue, tiefere Einblicke in DLSS 4 und die Multi Frame Generation freuen, dann auch mit weiteren RTX-Grafikkarten.

Ihre Meinung ist gefragt!

Was halten Sie von DLSS 4? Nutzen Sie die Kommentarfunktion und teilen Sie uns Ihre Meinung mit. Beachten Sie beim Kommentieren aber bitte die Forenregeln. Folgen Sie uns außerdem für Neuigkeiten in der Hardware-Welt oder unsere exklusiven Inhalte gern auf Whatsapp und X. Unsere Video-Inhalte (oftmals gewürzt mit einer Prise Humor) finden Sie bei Youtube, Instagram und Tiktok.