Geforce RTX 4070 Ti Launch - DLSS 3.0 und die clevere Frame-Generation
Mit der RTX 4070 Ti ist zu Beginn des Jahres die erste RTX-4000er-GPU unterhalb der 1.000-Euro-Preisgrenze erschienen. Während Grafikkarten-Guru Raff Ihnen im umfangreichen Test frische Grafik-Benchmarks präsentiert und Jan Custom-Modelle testet, wollen wir an dieser Stelle einen neuerlichen Blick auf Nvidias DLSS 3.0 und die Frame-Generation werfen.
In diesem Artikel
Kaum hat das neue Jahr begonnen, schon wartet frische Hardware darauf, getestet zu werden. Soeben ist Nvidias neue RTX 4070 Ti erschienen, der aktuell jüngste Ableger der Ada-Lovelace-Generation und mit ihr die erste Grafikkarte der noch jungen RTX-4000er-Reihe unterhalb der 1.000-Euro-Preisgrenze (nun ja, offiziell zumindest). Während Grafikkarten-Guru Raff Nvidias neuen Pixelbeschleuniger in unserem gewohnt umfangreichen Test auf Herz und Nieren prüft und Jan die Custom-Modelle unter die Lupe nimmt, wollen wir in diesem Artikel DLSS 3.0 und die Frame-Generation einem neuerlichen Blick unterziehen. Wie gut funktioniert die clevere KI-Frame-Interpolation mit der neuen Grafikkarte, was gibt es bei DLSS 3.0 generell zu beachten und mit welchen Einstellungen laufen aktuelle Spiele in feiner Raytracing-Pracht mit der RTX 4070 Ti besonders geschmeidig?
Ada-Lovelace und DLSS 3.0 - Eine kurze Zusammenfassung
Bevor wir zu Performance-Messungen, der Bildqualität und unseren Beobachtungen kommen, wollen wir die Absicht und Funktionsweise von DLSS 3.0 respektive der Frame-Generation noch einmal kurz zusammenfassen und einige Aspekte hervorheben, die Auswirkungen auf die Präsentation und die gefühlte Performance haben. Falls Sie zusätzliche Informationen wünschen, legen wir Ihnen unseren Artikel zum Launch der RTX 4090 ans Herz, obendrein bieten wir in unseren Artikeln zu Intels XeSS sowie zuvor gehenden Abhandlungen zu AMDs FSR 2.0 weitere Einblicke in die Funktionsweise moderner Upsampling-Technologien. Während sich Nvidias DLSS ein wenig von den Konkurrenz-Technologien unterscheidet und DLSS 3.0 mit der Frame-Generation nochmals einen Schritt weitergeht und eine (optionale) KI-Frame-Interpolation ergänzt, ähneln sich die Upsampling-Verfahren im Kern recht stark. Um zu verstehen, wie DLSS 3.0 funktioniert, welche Vor- und Nachteile es mit sich bringt, ist es nützlich, zuerst die Funktionsweise von DLSS 2.x sowie den Konkurrenz-Verfahren grob zu überblicken.
DLSS 3.0 baut auf DLSS 2.x auf, ja nutzt im Grunde das gleiche Upsampling-Verfahren wie Spiele mit DLSS-2.x-Support. Die entsprechende DLL-Datei liegt wie gewohnt im jeweiligen Spieleordner. DLSS 3.0 ergänzt indes eine weitere DLL-Datei (nvn_dlssg.dll), welche die Frame-Generation mit sich bringt. DLSS 3.0 respektive die neue Frame-Generation benötigt dabei interessanterweise nicht zwangsweise DLSS, um zu funktionieren, sondern im Grunde nur eine temporale Kantenglättung. In vielen Spielen lässt sich die Frame-Generation auch mit dem spielinternen TAA und damit in nativer Renderauflösung oder mit einem Upsampling-Verfahren nutzen. So können Sie etwa im Flight Sim die Frame-Generation auch mit TAA oder DLAA nutzen, in Spider-Man und dem Miles-Morales -Ableger können Sie außerdem Intels XeSS oder AMDs FSR 2.x sowie das spielinterne IGIT-Upsampling mit der Frame-Generation kombinieren, sollten Sie denn so wollen. Nötig für DLSS 3.0 ist allerdings zwingend eine Nvidia RTX-GPU der Ada-Lovelace-Generation. Und in diesem Artikel dreht sich natürlich alles um die RTX 4070 Ti.
Neben den für DLSS 2.x sowie die Konkurrenztechniken in Form von Intels XeSS oder AMDs FSR 2.x nötigen drei Inputs - dem Color- und Depth Buffer sowie den Bewegungsvektoren - benötigt DLSS 3.0 einen weiteren Input. Die Frame-Generation muss also nochmals zusätzlich spezifisch von einem Spiel unterstützt, von Entwicklern integriert werden, um zu funktionieren. Für die Frame-Generation nutzen Nvidias neue RTX-4000er-GPUs sogenannte Optical Flow Fields. Diese Technologie wird unter anderem in der Robotik zur Bewegungserkennung und Navigation oder etwa in Video-Codecs zur Vermeidung von Artefakten bei Bewegung eingesetzt und ist im Grunde eine Verfeinerung der Bewegungsvektoren. Gegenüber Letzteren können Optical Flow Fields das Bild nochmals genauer erfassen, Bewegungen auch Pixel-feiner Elemente wesentlich akkurater erkennen. Dies ist ein wichtiger Punkt für DLSS 3.0 beziehungsweise die Frame-Generation, da die Bewegung des Bildes von einem Frame auf den nächsten genau nachvollzogen werden muss, um den interpolierten Frame sauber und ohne sichtbare Sprünge zwischen diese platzieren zu können - merken Sie sich diesen Umstand, wir kommen später noch einmal darauf zurück.
DLSS 3.0 - Die magische Bildverdoppelung für die RTX 4070 Ti?
Mit DLSS 3.0 können Nvidias RTX-4000er-GPUs also mithilfe zuvor berechneter Bilder und mit Unterstützung durch das neuronale Netzwerk Zwischenbilder interpolieren. Auf ein voll von CPU und GPU berechnetes Bild folgt ein interpoliertes, darauf wieder ein voll berechnetes. Dies funktioniert auch im CPU-Limit, im Optimalfall können die Bildraten mit Frame-Generation also tatsächlich verdoppelt werden. Dies kommt allerdings mit einigen Nebeneffekten. Zu diesen zählt eine gegenüber DLSS ohne Frame Generation erhöhte Latenz, die entsteht, weil ein Bild vorenthalten werden muss, darauf ein Zweites berechnet wird, ein Frame durch DLSS 3.0 generiert und zwischen die berechneten Bilder eingeschoben wird - und diese Bilder erst im Anschluss ausgegeben werden können. Da währenddessen keine Eingabe des Spielers verarbeitet werden kann, entsteht eine - je nach Spiel, Framerate und persönlicher Empfindsamkeit - möglicherweise spürbare Eingabeverzögerung.
Letzteres ist auch Nvidia bewusst und ebendarum kommt bei DLSS 3.0 - oft automatisch beziehungsweise erzwungenermaßen - Nvidias Reflex zum Einsatz. Reflex kommuniziert via einer API direkt mit dem Spiel respektive Software und weist den Renderer an, bereits von der CPU berechnete Frames auf sofortigem Wege zur Weiterverarbeitung durch die GPU zu senden. Im Regelfall halten Spiele einen oder mehr CPU-Frames zurück, um bei Streaming-Problemen, kurzfristig erhöhter Prozessorlast oder anderen Verzögerungen weiterhin Frames an die GPU liefern zu können und somit die Hardware- beziehungsweise Grafikkarten-Auslastung aufrecht zu erhalten, die Latenzen anzugleichen (mit Reflex sind sie zwar kürzer, schwanken ohne Fps-Limit aber auch stärker) und eine höhere Effizienz der Hardware zu gewährleisten.
Durch dieses Zurückhalten der CPU-Frames - diese sind bereits so weit berechnet, dass Ihre aktuelle Eingabe keinen Einfluss mehr auf diese hat - entsteht allerdings ebenfalls eine Eingabeverzögerung. Reflex unterbindet diese also, spart an dieser Stelle Latenz ein, um wiederum jene zu kompensieren, die durch die Frame Generation respektive DLSS 3.0 entsteht. Dies funktioniert allerdings nur, wenn die CPU überhaupt Frames zurückhält, was nur im Grafiklimit der Fall ist - im Prozessorlimit liefert die CPU der Grafikkarte berechnete Frames bereits so schnell sie kann, Reflex funktioniert in diesem Szenario also nicht. Damit die Frame-Generation also bestmöglich funktioniert, gilt es, dem CPU-Limit fernzubleiben. Ein großer Vorteil ist nun allerdings, dass Framelimits, Ingame-Bildratenbegrenzungen und V-Sync zusammen mit DLSS 3.0 funktionieren, ein Umstand, der zum Launch der RTX 4090 noch nicht gegeben war.
Ein weiterer Nebeneffekt - oder besser: Weitere Nebeneffekte, denn sie treten in unterschiedlichen Formen auf - sind die KI-generierten Frames selbst. Denn diese weisen teils einige deutlich sichtbare Fehler auf. Recht typisch sind etwa "ausgefranst" wirkende Bildrisse und unvollständige, "zerrissene" Konturen, insbesondere bei zuvor verdeckten Elementen, also Teilen des Bildes, die einen Frame zuvor von einem anderen Objekt verdeckt wurden und kurz darauf sichtbar werden. In diesen Fällen fehlen für die Frame-Generation wichtige Informationen der betreffenden Elemente, was wiederum für eine unvollständige Darstellung dieser sorgt. Es gibt auch einige weitere Schwachstellen, eine davon betrifft etwa Parallax-Maps respektive die optische Illusion, mithilfe derer mittels Parallax-Mapping ein dreidimensionaler Eindruck bei Texturen suggeriert wird. Diese scheinen bei bestimmten, regelmäßigen Kamerabewegungen zu "springen". Sehr auffällig ist dieser Effekt etwa in A Plague Tale Requiem, insbesondere bei großen Mauerflächen, die häufig mit Parallax Maps verziert werden.
Quelle: PC Games Hardware
Quelle: PC Games Hardware
Quelle: PC Games Hardware
Quelle: PC Games Hardware
Quelle: PC Games Hardware
Ein weiteres mit DLSS 3.0 häufig sichtbares Phänomen sind "zerfaserte" und "hüpfende" HUD-Elemente oder etwa Namen von NPCs. All diese Umstände, die stellenweise fehlerhafte Darstellung des Spiele-Interfaces sowie die "hüpfenden" Parallax-Maps, gehen auf die Optical Flow Fields zurück. Bei einigen 2D-Elementen kann die KI von DLSS 3.0 nicht zweifelsfrei entscheiden, welche Position das HUD-Element in dem interpolierten Frame einnehmen soll - die KI entscheidet einmal so und ein andermal so. Diese "Entscheidungsfindung" resultiert in hin- und her-"hüpfenden", teilweise fehlerhaften oder gar doppelt dargestellten HUD-Elementen in den interpolierten Frames. Gut sichtbar sind diese Fehler etwa in The Witcher 3 bei den Namen der NPCs, Ortsmarkierungen im Flight Sim oder in Cyberpunk bei der Quest-Markierung. Bei A Plague Tale Requiem und den Parallax-Maps tritt unseres Erachtens das gleiche Phänomen auf, hier kann die Frame Generation nicht zweifelsfrei entscheiden, wie stark die Perspektive innerhalb der optisch plastischen, aber technisch flachen Texturen verschoben werden muss, um ein kohärentes Ergebnis zu liefern.
In A Plague Tale Requiem scheinen daher einige Texturen zu "zucken" und zu wabern, auf andere Augen wirken sie durch die kleinen Sprünge unscharf, wie Sie etwa in unserem Bildtest-Video nachvollziehen können. Wir haben bezüglich der anfälligen HUD-Elemente direkt bei Nvidia nachgehakt, die unsere Vermutungen bestätigten. Allerdings wurde in Aussicht gestellt, dass sich diese Fehler mit der Zeit mindern, da Nvidias neuronales Netzwerk die Entscheidungsfindung dank Lernfähigkeit verbessern kann. Und tatsächlich können wir zumindest subjektiv bestätigen, dass sich etwa Probleme mit der HUD-Darstellung seit unserem letzten größeren DLSS-3.0-Test vermindert haben. Die Markierungen im Flight Sim sind etwa wesentlich stabiler als noch während des RTX-4090-Launches und sogar in The Witcher 3 hüpfen die NPC-Namen in der Release-Fassung zwar deutlich sichtbar, doch weniger stark als in der Event-Build, die wir während unseres Mifcom-Besuchs ausprobieren konnten. Und die HUD-Elemente in Warhammer 40K Darktide weisen gar nur sporadisch Artefakte auf.
DLSS 3.0 - Eine hohe Framerate bedeutet eine hohe Bildqualität
Soweit zu unserer groben Zusammenfassung von Nvidias DLSS 3.0. Doch bevor wir zu der RTX 4070 Ti und unseren Messungen kommen: Nun kommt der für die Frame-Generation eigentlich wirklich wichtige Punkt: die Bildrate. Denn je höher diese ist, desto kürzer sind die interpolierten Bilder auf dem Bildschirm sichtbar, desto weniger auffällig sind Fehldarstellungen und desto kürzer ist auch die Eingabelatenz und der durch die Interpolation anfallende Lag respektive die durch Reflex nötige Latenz-Ersparnis an anderer Stelle. DLSS 3.0 spielt die Stärken der Technologie um die interpolierten Frames also insbesondere bei höheren Bildraten aus. Oder auf andere Art formuliert: Die Frame-Generation von DLSS 3.0 soll nicht dazu dienen, Ihre Bildraten auf ein spielbares Niveau zu hieven. Dies ist die Aufgabe von DLSS, also dem Upsampling-Teil von DLSS 3.0. Die Frame-Generation dient dazu, diese Bildraten (deutlich) zu erhöhen und für ein geschmeidigeres, flüssigeres Spielerlebnis zu sorgen. DLSS 3.0 soll Ihre Bildrate also nicht etwa von 30 auf 60, sondern von eher von 60 auf 120 Fps erhöhen. Ebendarum empfiehlt Nvidia eine Ausgangsbasis(!) von 50 bis 60 Fps für den Einsatz der Frame Generation.
Dies ist der wichtigste Punkt, den es zu beachten gilt. Denn wenn Sie DLSS 3.0 auf diese Art und Weise einsetzen, also beispielsweise Upsampling nutzen, um mit voller Raytracing-Pracht auf 50-60 Fps zu kommen und erst darauf, bei bereits relativ hohen Bildraten die Frame-Generation zuzuschalten, dann entwickelt Nvidias spannende Technik ihr volles Potenzial. So spannend und technisch fortschrittlich DLSS 3.0 also auf der einen Seite ist, das volle Potenzial eröffnet sich erst unter bestimmten Voraussetzungen. Wie Sie diese mit der RTX 4070 Ti ausnutzen und wie viel aus einigen aktuellen Spielen mit der Frame-Generation herauszukitzeln ist, das wollen wir nun mit einigen Messungen aufzeigen.

Hab heute Darktide selbst das erste Mal mit DLSS und FG inkl. Raytracing gezockt und bin erstaunt über 3 stellige FPS in UWQHD. Dank eurem Test auch auf 120 FPS gelockt und ich bin begeistert.
Vor FG hätte ich Raytracing in meiner Auflösung mit der 4070ti abgeschrieben. Aber die 4000er Generation ist doch ein starkes Stück Technik und ich hab grad einfach Spaß an einer enormen Bildpracht in verdammt flüssig
Als Beispiel zu Darktide: WQHD DLSS Quality ... das ist dann was für ein DLSS? 1.0 oder 2.0?
Bisher habe ich DLSS/FSR noch nie benutzt ... bin nicht mal sicher ob meine 1080 so was könnte ... was aber egal ist weil ich in Full HD spiele und da ist die 1080 eh per VSync auf 60 fps begrenzt und somit sogut wie nie ausgelastet.
Ebendarum empfiehlt Nvidia eine Ausgangsbasis(!) von 50 bis 60 Fps für den Einsatz der Frame Generation.
Leider kann ich das nicht selbst ausprobieren, da ich immer noch beim Treiber 522.25 bin und wegen des wddm-Bugs HAGS deaktiviert habe.
Vielen Dank für den schönen Artikel. Ich habe die selben Erfahrungen mit Witcher 3 NextGen gemacht. Ich wollte mit der 4090 eigentlich die Finger von FrameGeneration lassen. Nun ja, in dem Spiel stören die Ruckler ohne FG schon sehr. Ich habe ein paar Fragen bzgl. Reflex:
Reflex ist in der Systemsteuerung der "low latancy mode" => richtig?
Im Spiel wird es als Reflex beschrieben. Nun gibt es aber 3 Einstellungsmöglichkeiten: "off", "on" und "ultra". Nehmt ihr bei euren Tests: "on" oder "ultra" bzw. welches ist im Zusammenhang mit DLSS3 empfehlenswerter?
Ansonsten weiter so und LG aus Nürnberg.
Alleine schon weil ich persönlich keine 500FPS plus in irgendwelchen Menüs brauche, für die die Karte dann anfängt Saft zu verbraten und die Lüfter hochzudrehen, wo es gar nicht benötigt wird (und in Titeln wie Total War schon 3x nicht, selbst im eigentlichen Spiel selbst, wo auch konstante 30FPS noch smooth genug, in Schlachten sind)...
Aber auch ein State of Decay 2 (mit sehr früher Version der UE4) hasst hohe FPS (definitiv kein Kandidat für DLSS 3 plus Reflex), weil bei Frames über 50 bis 60 im Spiel diese so unsauber werden das man trotz 90FPS und Reflex, beim Autofahren, schlimmer lagt als würden die FPS kurzzeitig von 60 auf 28 runterdroppen.
Was da dann Multiplayer Titel wie Darktide, oder auch Payday 2, bzw. baldige 3, wie noch kommende Blight Survival angeht, stimmt, da war es vermutlich noch ehr zu vermuten.
Trotzdem, es so auch belegt zu haben, dass es davon profitiert, ist gut und macht die Technologie halt, wenn auch bedingt, abseits des Singleplayer interessant / nützlich, als Nutzer.
Ansonsten immer gerne, Koop-Multiplayer-Spiele wie Vermintide / Darktide macht mit jedem Spieler, jenseits von 1, bis zum Maximum von 4, üblicherweise mehr Spaß, außer es sind ggf. "etwas spezielle zugeloste randoms".