Stable Diffusion "XL Turbo": Fake-Bilder werden in Echtzeit per KI generiert
Das KI-Tool Stable Diffusion erlaubt es Nutzern jetzt auch, Bilder in Echtzeit zu generieren. Mit "XL Turbo" präsentierte das Unternehmen Stability AI ein neues Feature, welches Interessierte nun in einer Betaversion ausprobieren können.
Der Bildgenerator Stable Diffusion wird um eine rasante Möglichkeit erweitert: Mit "XL Turbo" präsentierte das dahinter stehende Unternehmen Stability AI eine neue generative KI, die Bilder anhand eingegebener Textprompts in Echtzeit erstellen könne. Das zugrundeliegende Feature "Adversarial Diffusion Distillation" (ADD) wird in einem kurzen Youtube-Clip vorgeführt und lässt sich unter anderem auf der zu Stability AI gehörenden Webseite Clipdrop testen.
In einem kurzen Eigentest zeigt sich, dass das Versprechen der Echtzeit beinahe eingelöst wird; tatsächlich benötigt Stable Diffusion Turbo XL nur wenige Sekunden, um aus einem Textprompt ein Bild zu generieren. Auch reagiert die neue Funktion in Stable Diffusion - wiederum in Sekundenschnelle - auf Änderungen in der Texteingabe. Qualitativ sind hier je nach Eingabe aber noch einige KI-typische Mängel zu erkennen. Statt den regulären 50 Inferencingschritten soll ADD dem offiziellen Forschungspapier zufolge nur einen bis vier solcher Schritte benötigen.
In diesem geht Stability AI auch auf die Funktionsweise von ADD ein. Hier wird eine Kombination aus "DM-Teacher" und "ADD-Student" genutzt, die die entsprechend benötigte Geschwindigkeit für vernünftige Ergebnisse erreichen sollen. Je mächtiger die genutzte Grafikkarte ist, desto schneller und beeindruckender sollen die Resultate sein: Wie Stability AI erklärt, könne eine Nvidia A100 ein 512 x 512 Pixel großes Bild so innerhalb von 207 Millisekunden generieren.
In dieser Zeit sei auch die Kodierung, ein einzelner Schritt für Denoising sowie die Dekodierung inbegriffen. Solche Geschwindigkeiten könnten auch ein wichtiger Schritt für die KI-Generierung von Videos werden, wie etwa das Portal Ars Technica spekuliert - hierfür hat Stability AI mit "Stability Video Diffusion" in der vergangenen Woche ebenfalls eine neue Technik vorgestellt.
