Nvidia: Neues KI-Tool generiert "effizient" Bilder und passt auf eine Diskette

News 07.08.2023 um 09:38 Uhr Claus Ludewig Als bevorzugte Quelle auf Google hinzufügen

Quelle: Preecha Siriburanakit, 123RF.com

Gemeinsam mit der Universität in Tel-Aviv hat Nvidia ein neues KI-Tool zur Bilderstellung vorgestellt. Mittels Perfusion sollen sich Bilder effizient erstellen lassen, das KI-Tool selbst hat nur einen geringen Speicherbedarf.

Seit Anfang des Jahres ist ChatGPT in aller Munde. Mittels kurzer Texteingaben lassen sich ganze Briefe u. v. m. generieren. Durch die sogenannten Prompts können auch Bilder generiert werden, wie etwa Midjourney oder Dall-E von Open AI aufzeigen. Um jedoch Bilder anhand von Texteingaben erstellen zu können, müssen die KI-Tools mit einer Vielzahl an Bildern vorab trainiert werden. Hierzu werden Hunderte Millionen an Bildern benötigt. Nvidia hat nun ein neues KI-Bilderstellungstool vorgestellt, das gerade mal 100 KB groß ist und bei dem vier Minuten Training genügen.

Nvidia-KI: Mit "Key-Locking" sollen Bilder effizient erstellt werden

Nvidia setzt auf die neue Methode namens Perfusion, die gemeinsam mit der Tel-Aviv University entwickelt wurde. Zentral ist das Feature namens "Key-Locking". Hierbei wird immer der zentrale Oberbegriff, etwa Katze, in den Fokus des Bildes gestellt und zur Bilderstellung übergeordnete Kategorien gebildet. Wenn man etwa eine Katze zu einem Bild hinzufügen möchte, dann wird dies verknüpft mit einer breiteren "Vorstellung einer Katze". So werden verschiedene Interpretationen einer Katze im Kostüm ausgegeben. Um dennoch eindeutig als Katze erkannt zu werden, orientiert sich Nvidias KI an ein paar zentralen Punkten.

Im Gegensatz zu bisherigen KI-Tools werden die Bilder nicht isoliert gelernt, sondern in einen Kontext eingebettet. So können Nutzer bei Nvidias Tool den Bilderstellungsprozess durch Texteingabeaufforderungen leiten und mehrere Konzepte zusammenführen. So muss das KI-Tool nicht ständig neu trainiert werden, sodass sich der Speicherbedarf in Grenzen hält. Nvidia aktualisiert immer nur die Teile, die zur Feinabstimmung der Bilderzeugung benötigt werden, anstatt jedes Mal komplett neue Bilder zu erstellen.

Die Wissenschaftler geben zu, dass es manchmal zu Fehlinterpretationen kommen kann, da man sich bei den Prompts an ein Wort einer Oberkategorie halten muss. Angepasst wird immer auch nur ein 100-KB-Modell, sodass die Bildgröße wohl ebenfalls nicht riesig ausfällt. Aktuell gibt es lediglich das Forschungspapier zum KI-Tool, sodass man sich in Geduld üben muss, ehe man selbst Bilder via Nvidia-KI erstellen lassen kann. Bereits verfügbar ist etwa Midjourney oder Microsoft Bing mit Dall-E. Bei Adobe Photoshop steht mit Firefly noch in diesem Jahr ein KI-Tool zur Erstellung als Update parat. Zu beachten ist, dass die urheberrechtliche Frage oftmals unklar bleibt.

Ebenfalls lesenswert: Firefly: Adobe zeigt beeindruckende KI-Ergebnisse in Photoshop

Empfohlener redaktioneller Inhalt [EMBED_URL] An dieser Stelle finden Sie externe Inhalte von [PLATTFORM]. Zum Schutz Ihrer persönlichen Daten werden externe Einbindungen erst angezeigt, wenn Sie dies durch Klick auf "Alle externen Inhalte laden" bestätigen: Ich bin damit einverstanden, dass mir externe Inhalte angezeigt werden. Damit werden personenbezogene Daten an Drittplattformen übermittelt. Mehr dazu in unserer Datenschutzerklärung.

Externe Inhalte Mehr dazu in unserer Datenschutzerklärung.

Sammlung zu neuer Bilderstellungs-KI von Nvidia:

Nvidia hat gemeinsam mit der Tel-Aviv University eine neue Bilderstellungs-KI mit Perfusion entwickelt.
Zentral ist das Feature namens "Key-Locking". So werden immer nur die Teile, die zur Feinabstimmung der Bilderzeugung benötigt werden, anstatt jedes Mal komplett neue Bilder zu erstellen.
So soll der Speicherbedarf des KI-Tools bei 100 Kilobyte liegen und lediglich vier Minuten Training genügen.
Aktuell gibt es nur das Forschungspapier. Wann das KI-Tool getestet werden kann, ist noch offen.

Quelle: Decrypt

Artikel teilen

Nvidia: Neues KI-Tool generiert "effizient" Bilder und passt auf eine Diskette Gemeinsam mit der Universität in Tel-Aviv hat Nvidia ein neues KI-Tool zur Bilderstellung vorgestellt. Mittels Perfusion sollen sich Bilder effizient erstellen lassen, das KI-Tool selbst hat nur einen geringen Speicherbedarf.

Per E-Mail versenden

Nvidia-KI: Mit "Key-Locking" sollen Bilder effizient erstellt werden

Artikel teilen

Kommentare (5)