Beunruhigend gute Microsoft-Technologie: Foto und Audio wird zum sprechenden Video

8
News Jusuf Hatic Als bevorzugte Quelle auf Google hinzufügen
Beunruhigend gute Microsoft-Technologie: Foto und Audio wird zum sprechenden Video
Quelle: Microsoft

Ein Forschungsteam von Microsoft stellt mit VASA-1 eine neue KI vor, die mithilfe eines einfachen Passfotos und einer Audiodatei "ein lebensechtes Video" generiert

OpenAI hat mit Sora den ersten Schritt gemacht, nun zieht Microsoft nach: Wie ein Forschungsteam des Redmonder Unternehmens erklärt, hat man mit VASA-1 ein Modell für lebensechte Avatare entwickelt, welches insbesondere den Vorteil der Echtzeitberechnung auf seiner Seite sieht.

Die Anforderungen für ein solches generiertes Video sind ähnlich genügsam. Hier reicht ein einziges Foto einer Person im Stile eines biometrischen Passbildes sowie eine Tonspur, die beispielsweise von klassischer Text-to-Speech-Software stammen kann. VASA-1 kann hieraus ein "hyperrealistisches Video" erzeugen, welches in der Offline-Verarbeitung bei einer Auflösung von 512 x 512 Pixeln sowie 45 Fps geschieht. Genutzt wurde hierfür eine herkömmliche Nvidia Geforce RTX 4090 - die Latenz soll gerade einmal bei 170 Millisekunden liegen.

Anwender können innerhalb von VASA-1 einzelne Parameter festlegen. So sei etwa die Blickrichtung, Neigungswinkel des Kopfes oder die Stimmhöhe anpassbar. Im Hinblick auf die Animationen selbst hätten sich bisherige KI-Modelle den Forschern zufolge primär auf die lippensynchrone Wiedergabe spezialisiert - VASA-1 hingegen könne zusätzlich dazu auch realistische Kopfbewegungen, Mimik oder weitere Feinheiten "lebensecht" animieren.

Empfohlener redaktioneller Inhalt [EMBED_URL] An dieser Stelle finden Sie externe Inhalte von [PLATTFORM]. Zum Schutz Ihrer persönlichen Daten werden externe Einbindungen erst angezeigt, wenn Sie dies durch Klick auf "Alle externen Inhalte laden" bestätigen: Ich bin damit einverstanden, dass mir externe Inhalte angezeigt werden. Damit werden personenbezogene Daten an Drittplattformen übermittelt. Mehr dazu in unserer Datenschutzerklärung.
Externe Inhalte Mehr dazu in unserer Datenschutzerklärung.

Komplett einwandfrei sind aber auch diese generierten Videos nicht, zumindest auf den zweiten Blick. So wirken einige der "Kopfzuckungen" unnatürlich; zudem sind innerhalb einzelner Mundbewegungen verformte Zähne zu sehen. Immerhin soll es sich bei VASA-1 ausschließlich um ein Forschungsprojekt zu Demonstrationszwecken handeln, ein Produkt oder API-Release sei nicht vorgesehen. Wie das Forschungsteam beteuert, sei man sich der Möglichkeit des Missbrauchs solcher KI-Modelle bewusst, hebt allerdings auch das "erhebliche positive Potenzial der Technik" hervor.

Quelle: Microsoft

8
    • Kommentare (8)

      Zur Diskussion im Forum
      • Von George-Broussard PC-Selbstbauer(in)
        [Ins Forum, um diesen Inhalt zu sehen], falls Du dich wunderst wegen der Zitat-Benachrichtigung an Dich:

        Ich habe meinen Post gelöscht da ich mich nicht mehr mit den negativen Auswirkungen, welche das aktuelle und künftige Weltgeschehen mit sich bringt, auseinander setzen möchte.

        Alles wird gut

        Beeindruckende und erschreckende Technologie zugleich.
      • Von George-Broussard PC-Selbstbauer(in)
        [Ins Forum, um diesen Inhalt zu sehen], falls Du dich wunderst wegen der Zitat-Benachrichtigung an Dich:

        Ich habe meinen Post gelöscht da ich mich nicht mehr mit den negativen Auswirkungen, welche das aktuelle und künftige Weltgeschehen mit sich bringt, auseinander setzen möchte.

        Alles wird gut

        Beeindruckende und erschreckende Technologie zugleich.
      • Von T-MAXX Volt-Modder(in)
        So kann man schnell Fake News & Co verbreiten und keiner wird es merken.
        Dieser KI Trend ist ganz klar besorgniserregend und zugleich ein gefährlicher Weg in die Zukunft.
      • Von pbStoRm Freizeitschrauber(in)
        Das Uncanny Valley ist zum Glück recht tief, weshalb man die Beispiele für VASA1 auch noch gut als Fake erkennt. Aber wenn es noch 10 Jahre weiter geht, dann müssen Mittel und Wege gefunden werden, wie KI-Inhalte immer und überall erzwungen markiert werden können und man muss bei jedem Schnippel davon ausgehen, dass es ein Fake ist.
      • Von Misanthrop68 Volt-Modder(in)
        Zitat von Major_Fletcher
        Jede Technologie kann man positiv oder negativ (kriminell) einsetzen.
        Manchmal vergesse ich aufgrund der Kommentare, dass ich hier in einem PC Hardware Forum bin. Sollte man hier nicht etwas euphorischer sein, bei solchen Erfindungen? Der Fortschritt ist nicht aufzuhalten und mit den ganzen ablehnenden Haltungen machen sich viele erst recht obsolete.

        Lieber danach Ausschau halten, wie man das zukünftig vielleicht für sich nutzen kann, sich das Leben einfacher gestalten kann und nicht ständig darüber nachdenken, ob es wohl irgendwer, irgendwann zum Betrügen verwenden wird. Das liegt sowieso nicht in unsrer Macht, solange es sowas wie einen freien Willen gibt.

        Viele hier erinnern mich eher an meinen 80 jährigen Onkel der vor allem Angst hat sobald man das Wort K.I erwähnt, ohne dass er sich mal je näher mit der Materie beschäftigt hätte. Er kennt die Schlagwörter auch nur aus Zeitungen und Nachrichten im TV, wo natürlich auch immer ausschließlich positiv über diese Sachen berichtet wird.
        Meine doch reichliche Fantasie reicht nicht aus um mir positive Eigenschaften oder Anwendungen auszudenken, es kommen immer nur Dumme Sachen bei raus! Und darum kann ich kein gutes an diese Technik finden. Man muss nicht alles neue in den Himmel loben, erst recht nicht wenn es uns Schadet.
      • Von Major_Fletcher Software-Overclocker(in)
        Jede Technologie kann man positiv oder negativ (kriminell) einsetzen.
        Manchmal vergesse ich aufgrund der Kommentare, dass ich hier in einem PC Hardware Forum bin. Sollte man hier nicht etwas euphorischer sein, bei solchen Erfindungen? Der Fortschritt ist nicht aufzuhalten und mit den ganzen ablehnenden Haltungen machen sich viele erst recht obsolete.

        Lieber danach Ausschau halten, wie man das zukünftig vielleicht für sich nutzen kann, sich das Leben einfacher gestalten kann und nicht ständig darüber nachdenken, ob es wohl irgendwer, irgendwann zum Betrügen verwenden wird. Das liegt sowieso nicht in unsrer Macht, solange es sowas wie einen freien Willen gibt.

        Viele hier erinnern mich eher an meinen 80 jährigen Onkel der vor allem Angst hat sobald man das Wort K.I erwähnt, ohne dass er sich mal je näher mit der Materie beschäftigt hätte. Er kennt die Schlagwörter auch nur aus Zeitungen und Nachrichten im TV, wo natürlich auch immer ausschließlich positiv über diese Sachen berichtet wird.
      Direkt zum Diskussionsende
  • Print / Abo
    Apps
    PCGH Magazin 07/2026 PC Games 07/2026 play5 07/2026 N-Zone 07/2026 Linux Magazin 07/2026 LinuxUser 07/2026 Raspberry Pi Geek 07/2026
    PC Games Hardware PC Games Linux Magazin Raspberry Pi Geek Computec Kiosk