Beunruhigend gute Microsoft-Technologie: Foto und Audio wird zum sprechenden Video
Ein Forschungsteam von Microsoft stellt mit VASA-1 eine neue KI vor, die mithilfe eines einfachen Passfotos und einer Audiodatei "ein lebensechtes Video" generiert
OpenAI hat mit Sora den ersten Schritt gemacht, nun zieht Microsoft nach: Wie ein Forschungsteam des Redmonder Unternehmens erklärt, hat man mit VASA-1 ein Modell für lebensechte Avatare entwickelt, welches insbesondere den Vorteil der Echtzeitberechnung auf seiner Seite sieht.
Die Anforderungen für ein solches generiertes Video sind ähnlich genügsam. Hier reicht ein einziges Foto einer Person im Stile eines biometrischen Passbildes sowie eine Tonspur, die beispielsweise von klassischer Text-to-Speech-Software stammen kann. VASA-1 kann hieraus ein "hyperrealistisches Video" erzeugen, welches in der Offline-Verarbeitung bei einer Auflösung von 512 x 512 Pixeln sowie 45 Fps geschieht. Genutzt wurde hierfür eine herkömmliche Nvidia Geforce RTX 4090 - die Latenz soll gerade einmal bei 170 Millisekunden liegen.
Anwender können innerhalb von VASA-1 einzelne Parameter festlegen. So sei etwa die Blickrichtung, Neigungswinkel des Kopfes oder die Stimmhöhe anpassbar. Im Hinblick auf die Animationen selbst hätten sich bisherige KI-Modelle den Forschern zufolge primär auf die lippensynchrone Wiedergabe spezialisiert - VASA-1 hingegen könne zusätzlich dazu auch realistische Kopfbewegungen, Mimik oder weitere Feinheiten "lebensecht" animieren.
Komplett einwandfrei sind aber auch diese generierten Videos nicht, zumindest auf den zweiten Blick. So wirken einige der "Kopfzuckungen" unnatürlich; zudem sind innerhalb einzelner Mundbewegungen verformte Zähne zu sehen. Immerhin soll es sich bei VASA-1 ausschließlich um ein Forschungsprojekt zu Demonstrationszwecken handeln, ein Produkt oder API-Release sei nicht vorgesehen. Wie das Forschungsteam beteuert, sei man sich der Möglichkeit des Missbrauchs solcher KI-Modelle bewusst, hebt allerdings auch das "erhebliche positive Potenzial der Technik" hervor.
Quelle: Microsoft


Ich habe meinen Post gelöscht da ich mich nicht mehr mit den negativen Auswirkungen, welche das aktuelle und künftige Weltgeschehen mit sich bringt, auseinander setzen möchte.
Alles wird gut
Beeindruckende und erschreckende Technologie zugleich.
Dieser KI Trend ist ganz klar besorgniserregend und zugleich ein gefährlicher Weg in die Zukunft.
Manchmal vergesse ich aufgrund der Kommentare, dass ich hier in einem PC Hardware Forum bin. Sollte man hier nicht etwas euphorischer sein, bei solchen Erfindungen? Der Fortschritt ist nicht aufzuhalten und mit den ganzen ablehnenden Haltungen machen sich viele erst recht obsolete.
Lieber danach Ausschau halten, wie man das zukünftig vielleicht für sich nutzen kann, sich das Leben einfacher gestalten kann und nicht ständig darüber nachdenken, ob es wohl irgendwer, irgendwann zum Betrügen verwenden wird. Das liegt sowieso nicht in unsrer Macht, solange es sowas wie einen freien Willen gibt.
Viele hier erinnern mich eher an meinen 80 jährigen Onkel der vor allem Angst hat sobald man das Wort K.I erwähnt, ohne dass er sich mal je näher mit der Materie beschäftigt hätte. Er kennt die Schlagwörter auch nur aus Zeitungen und Nachrichten im TV, wo natürlich auch immer ausschließlich positiv über diese Sachen berichtet wird.
Manchmal vergesse ich aufgrund der Kommentare, dass ich hier in einem PC Hardware Forum bin. Sollte man hier nicht etwas euphorischer sein, bei solchen Erfindungen? Der Fortschritt ist nicht aufzuhalten und mit den ganzen ablehnenden Haltungen machen sich viele erst recht obsolete.
Lieber danach Ausschau halten, wie man das zukünftig vielleicht für sich nutzen kann, sich das Leben einfacher gestalten kann und nicht ständig darüber nachdenken, ob es wohl irgendwer, irgendwann zum Betrügen verwenden wird. Das liegt sowieso nicht in unsrer Macht, solange es sowas wie einen freien Willen gibt.
Viele hier erinnern mich eher an meinen 80 jährigen Onkel der vor allem Angst hat sobald man das Wort K.I erwähnt, ohne dass er sich mal je näher mit der Materie beschäftigt hätte. Er kennt die Schlagwörter auch nur aus Zeitungen und Nachrichten im TV, wo natürlich auch immer ausschließlich positiv über diese Sachen berichtet wird.