Nvidia: Butterweiche Superzeitlupe dank Deep Learning

30
News Antonio Funes Als bevorzugte Quelle auf Google hinzufügen
Nvidia: Dank Deep Learning ruckelfreie Videozeitlupen
Quelle: Screenshot Nvidia-Video

Um ruckelfreie Zeitlupen zu bieten, muss ein Video mit einer hohen Anzahl an Bildern pro Sekunde aufgenommen werden. Die entsprechenden Kameras sind jedoch exorbitant teuer. Mit einer auf Deep Learning basierenden Software von Nvidia könnte man in Zukunft aber auch Videos, die mit nur 30 oder 60 Bildern pro Sekunde aufgenommen wurden, als butterweiche Superzeitlupe abspielen.

Nvidia arbeitet an einer Methode, um auch Videos mit einer eher geringen Fps-Zahl (Bilder pro Sekunde) ruckelfrei als Zeitlupe abspielen zu können. Ein Video von Nvidia mit einigen Beispielen dazu haben wir weiter unten platziert. Auch die Website Geekologie berichtet über die erstaunlichen Ergebnisse. Doch worum geht es? Möchte man ein normales Video in Zeitlupe abspielen, dann kommt es unweigerlich zu Rucklern, wenn das Videomaterial nicht schon mit einem hohen Fps-Wert aufgenommen wurde. Nur mit speziellen Kameras, die sehr viele Bilder pro Sekunde liefern, sind gute Zeitlupen möglich.

Nehmen wir als Beispiel eine Szene, die fünf Sekunden dauert und mit 30 Fps aufgenommen wurde. Dies sind in der Summe 5 x 30, also 150 Bilder. Will man nun eine Zeitlupe anschauen, bei der das Video drei Mal langsamer als üblich abläuft, müssen die 150 Bilder auf 15 Sekunden verteilt werden - es bleiben nur noch 150 geteilt durch 15, also 10 Bilder pro Sekunde übrig - das Zeitlupenvideo ruckelt daher sichtbar.

Bei Spielen hat man dieses Problem nicht, denn das Spiel kann pro Sekunde immer gleich viele Bilder berechnen: wenn der PC bei einem Spiel 60 Fps schafft, dann sind es immer 60 Fps, egal ob eine Szene in der Spielewelt in Echtzeit oder in Zeitlupe abläuft. Diese Tatsache, nämlich dass ein PC auch einzelne Bilder neu berechnen kann, hat sich Nvidia nun im Rahmen der zahlreichen Research-Projekte, an denen die Kalifornier arbeiten, zu Nutze gemacht. Denn durch Deep-Learning-Prozesse, bei denen Software mit einer gewissen eigenen Intelligenz seine eigenen Algorithmen im Laufe der Zeit durch Lerneffekte stetig verbessert, können auch Zeitlupen von echten Videos butterweich und mit vielen Details ausgestattet abgespielt werden, die eigentlich zu wenig Fps für eine ruckelfreie Zeitlupe bieten. Die Software berechnet dabei für das vorhandene Video Zwischenbilder, die in Wahrheit gar nicht existieren. Es entsteht also eine Art Simulation eines Videos, das viel mehr als nur beispielsweise 30 oder 60 Fps hat. Die Idee ist zwar nicht neu, aber durch die Deep-Learning-Prozesse gelingen Nvidia nun immer bessere Ergebnisse. Aus einem 30 Fps-Video wird beispielweise ein Zeitlupenvideo, für das man eigentlich 240 Fps als Ausgangsmaterial benötigen würde. Teure spezielle Zeitlupenkameras könnten mit einem solchen Verfahren in der Zukunft also in vielen Anwendungsfällen obsolet werden.

30
    • Kommentare (30)

      Zur Diskussion im Forum
      • Von amdahl Volt-Modder(in)
        Ich glaube wir meinen fast das Gleiche. Ich würde den Anwendungsbereich nicht auf ein bestimmtes Themengebiet wie z.B. "Entertainment" beschränken.
        Wenn man weiß was man tut kann man es auch im technischen und wissenschaftlichen Bereich anwenden. Eine der Kernkompetenzen hier ist ja die richtige Methode für das gegebene Problem auszuwählen.
        PIV-Messdaten mit so etwas zu verhunzen käme mir auch nicht unter
      • Von amdahl Volt-Modder(in)
        Ich glaube wir meinen fast das Gleiche. Ich würde den Anwendungsbereich nicht auf ein bestimmtes Themengebiet wie z.B. "Entertainment" beschränken.
        Wenn man weiß was man tut kann man es auch im technischen und wissenschaftlichen Bereich anwenden. Eine der Kernkompetenzen hier ist ja die richtige Methode für das gegebene Problem auszuwählen.
        PIV-Messdaten mit so etwas zu verhunzen käme mir auch nicht unter
      • Von Futhark Komplett-PC-Aufrüster(in)
        Zitat von amdahl
        Will man also -zusätzlich zur gewissenhaften Auswertung der Simulationsdaten- noch eine hübsche Animation erstellen um z.B. Geldgeber zu beeindrucken kann man oft nicht beliebig viele Zeitschritte in beliebig kleinen Intervallen verwenden. Wenn man hier z.B. nur jeder vierte Frame tatsächlich erzeugen muss und den Rest interpolieren kann damit die Animation besser aussieht ist viel gewonnen.
        Das hängt stark vom Themenbereich ab. In meinem Bereich z.B. lassen sich die Geldgeber nicht durch schicke Animationen breitschlagen. Da sitzen Gremien, die Zahlen und Argumente sehen wollen.

        Zitat von amdahl
        Um mal das Beispiel partikelbasierter Simulationen aufzugreifen: da zählen Statistiken, keine Animationen.
        Es gibt auch Messungen , z.B. von Turbulenzen, in denen kleine Partikel als Tracking-Partikel verwendet werden. Da wird dann mit einem Laser beleuchtet und mit einer Hochgeschwindigkeitskamera wird der aktuelle Zustand der Trackingpartikel aufgenommen.
        Wenn dabei dann so eine "Rate-Slowmotion" herumpfuschen würde, wäre das absolut katastrophal.

        Aber ich glaube, wir meinen beide das selbe: Dass es auf den Anwendungsbereich angekommt, oder?
        Im Entertainment - super!
        Wenn es um relevante Bildinformationen geht - gefährlich!

        Das ist übrigens heutzutage ein wichtiger Punkt:
        Wir müssen immer wieder verdammt aufpassen, dass sich nicht irgendwelche "Super-Duper-Automatik-Postprocessing-Verschlimmbesserer"-Funktionen an unseren Rohdaten vergreifen.
        Einige Hersteller von Messgeräten scheinen es sehr gut zu meinen mit diesen Autokorrekturen. Aber leider sind diese Funktionen meistens entweder zu undurchsichtig, wie sie wirklich funktionieren, oder sind nicht zuverlässig genug. Beides kann nicht zu guter wissenschaftlicher Praxis führen.
      • Von Casurin BIOS-Overclocker(in)
        Das "neue" an diesem verfahren ist nicht das Konzept dahinter - das ist hinreichend bekannt und alt - sondern die Implementierung:
        Schnell und recht akkurate, weitaus besser als die hier bereits verlinkten Tools sind.
        Es gibt noch immer genügend Szenarien wo die Fehler deutlich sichtbar werden, aber fürs Aufhübschen von Filmen ist es alle mal geeignet. Und: Auch heute wird diese Technik in vielen gebieten eingesetzt - zB bei vielen der 200/400Hz Fernseher, beim film-rendern usw.

        Ich glaube ein Objekterkenender Algorithmus aus Grundlage würde das ganze aber noch deutlich verbessern. Als beispiel kann man sich das Netz des Eishockeytors anschauen:
        Da der Algorithmus keine Objekte an sich kennt wird beim Interpolieren das netz mit dem Körper mit verzerrt. Mit einem ContentAware Ansatz könnte das Netz als eigenständiges Objekt verstanden und ohne Verzerrungen wiedergegeben werden.

        Zitat von Razilein
        Jedes halbwegs aktuelle Smartphone kann heutzutage gute Zeitlupenvideos aufnehmen (iPhone X mit 240 Frames pro Sekundein FullHD). Mir entzieht sich der Sinn einer "Zeitlupen KI".
        XDDD guter Scherz.
      • Von Laggy.NET
        Ist natürlich nichts neues, aber die Artefaktbildung ist geringer, als bei aktuell erhältlichen Tools und der Verlangsamsungfaktor von 8 bei 30 FPS Ausgangsmaterial ist auch extrem hoch.
        Von daher schon ziemlich beeindruckend.

        Wozu das jetzt gebraucht wird? Keine Ahnung. Für Echtzeit Zwischenbildberechung ist es eh zu aufwändig bzw. bis es in echtzeit möglich ist, wird eh alles mit genügend FPS aufgenommen werden.

        Wenns nach mir ginge, würde ich die Forschung eher bei Videostabilisierung ansetzen. Das ist praktisch eher relevant und ein ständiges Problem, das vor allem Softwareseitig schwer zu lösen ist.

        Es wäre auch eine Anwendung interessant, die aus niedrig aufgelösten Bildern hochauflösende macht. Ich glaube da gabs sogar in den letzten Monaten ne News bezüglich deep Learning.

        An sich wäre das nicht verkehrt. Auch wenn man nicht die Volle Auflösung ausnutzen will, wärs sicherlich genial, ein etwas weniger scharfes bzw. detailliertes Bild mit plausiblen detailinformationen aufblasen zu lassen, um es dann wieder auf die ursprüngliche Größe downzusamplen.
        Da der Informationsgehalt dann größer ist, sollte das Bild subjektiv auch deutlich an Details gewinnen. Ob die zusätzlichen Bildinformationen echt sind oder nicht ist ja egal. Was zählt ist die wahrgenommene Bildschärfe bzw. das Vorhandensien feiner Details. Selbst simples Bildrauschen trickst das Auge ja schon aus, und täuscht mehr Details vor, da sollte mit deep Learning deutlich mehr möglich sein.
      • Von Van25 Komplett-PC-Käufer(in)
        Zwischenzeilenberechnung fänd ich cool.
      Direkt zum Diskussionsende
  • Print / Abo
    Apps
    PCGH Magazin 07/2026 PC Games 06/2026 play5 07/2026 N-Zone 06/2026 Linux Magazin 06/2026 LinuxUser 06/2026 Raspberry Pi Geek 07/2026
    PC Games Hardware PC Games Linux Magazin Raspberry Pi Geek Computec Kiosk