Nvidia: Neues KI-Tool generiert "effizient" Bilder und passt auf eine Diskette
Gemeinsam mit der Universität in Tel-Aviv hat Nvidia ein neues KI-Tool zur Bilderstellung vorgestellt. Mittels Perfusion sollen sich Bilder effizient erstellen lassen, das KI-Tool selbst hat nur einen geringen Speicherbedarf.
Seit Anfang des Jahres ist ChatGPT in aller Munde. Mittels kurzer Texteingaben lassen sich ganze Briefe u. v. m. generieren. Durch die sogenannten Prompts können auch Bilder generiert werden, wie etwa Midjourney oder Dall-E von Open AI aufzeigen. Um jedoch Bilder anhand von Texteingaben erstellen zu können, müssen die KI-Tools mit einer Vielzahl an Bildern vorab trainiert werden. Hierzu werden Hunderte Millionen an Bildern benötigt. Nvidia hat nun ein neues KI-Bilderstellungstool vorgestellt, das gerade mal 100 KB groß ist und bei dem vier Minuten Training genügen.
Nvidia-KI: Mit "Key-Locking" sollen Bilder effizient erstellt werden
Nvidia setzt auf die neue Methode namens Perfusion, die gemeinsam mit der Tel-Aviv University entwickelt wurde. Zentral ist das Feature namens "Key-Locking". Hierbei wird immer der zentrale Oberbegriff, etwa Katze, in den Fokus des Bildes gestellt und zur Bilderstellung übergeordnete Kategorien gebildet. Wenn man etwa eine Katze zu einem Bild hinzufügen möchte, dann wird dies verknüpft mit einer breiteren "Vorstellung einer Katze". So werden verschiedene Interpretationen einer Katze im Kostüm ausgegeben. Um dennoch eindeutig als Katze erkannt zu werden, orientiert sich Nvidias KI an ein paar zentralen Punkten.
Im Gegensatz zu bisherigen KI-Tools werden die Bilder nicht isoliert gelernt, sondern in einen Kontext eingebettet. So können Nutzer bei Nvidias Tool den Bilderstellungsprozess durch Texteingabeaufforderungen leiten und mehrere Konzepte zusammenführen. So muss das KI-Tool nicht ständig neu trainiert werden, sodass sich der Speicherbedarf in Grenzen hält. Nvidia aktualisiert immer nur die Teile, die zur Feinabstimmung der Bilderzeugung benötigt werden, anstatt jedes Mal komplett neue Bilder zu erstellen.
Die Wissenschaftler geben zu, dass es manchmal zu Fehlinterpretationen kommen kann, da man sich bei den Prompts an ein Wort einer Oberkategorie halten muss. Angepasst wird immer auch nur ein 100-KB-Modell, sodass die Bildgröße wohl ebenfalls nicht riesig ausfällt. Aktuell gibt es lediglich das Forschungspapier zum KI-Tool, sodass man sich in Geduld üben muss, ehe man selbst Bilder via Nvidia-KI erstellen lassen kann. Bereits verfügbar ist etwa Midjourney oder Microsoft Bing mit Dall-E. Bei Adobe Photoshop steht mit Firefly noch in diesem Jahr ein KI-Tool zur Erstellung als Update parat. Zu beachten ist, dass die urheberrechtliche Frage oftmals unklar bleibt.
Ebenfalls lesenswert: Firefly: Adobe zeigt beeindruckende KI-Ergebnisse in Photoshop
Sammlung zu neuer Bilderstellungs-KI von Nvidia:
- Nvidia hat gemeinsam mit der Tel-Aviv University eine neue Bilderstellungs-KI mit Perfusion entwickelt.
- Zentral ist das Feature namens "Key-Locking". So werden immer nur die Teile, die zur Feinabstimmung der Bilderzeugung benötigt werden, anstatt jedes Mal komplett neue Bilder zu erstellen.
- So soll der Speicherbedarf des KI-Tools bei 100 Kilobyte liegen und lediglich vier Minuten Training genügen.
- Aktuell gibt es nur das Forschungspapier. Wann das KI-Tool getestet werden kann, ist noch offen.
Quelle: Decrypt

noch in meinen Retrokisten wäre doch mal was
TV´s ausgenommen
Es sollte dadurch ja um einiges günstiger werden. Wenn ich das noch richtig im Kopf habe (die eigentliche News ist schon ein bisschen älter), könnte das sogar eine 2060 locker schaffen.
TV´s ausgenommen