Nvidia: Neues KI-Tool generiert "effizient" Bilder und passt auf eine Diskette

5
News Claus Ludewig Als bevorzugte Quelle auf Google hinzufügen
Nvidia: Neues KI-Tool generiert "effizient" Bilder und passt auf eine Floppy-Disk
Quelle: Preecha Siriburanakit, 123RF.com

Gemeinsam mit der Universität in Tel-Aviv hat Nvidia ein neues KI-Tool zur Bilderstellung vorgestellt. Mittels Perfusion sollen sich Bilder effizient erstellen lassen, das KI-Tool selbst hat nur einen geringen Speicherbedarf.

Seit Anfang des Jahres ist ChatGPT in aller Munde. Mittels kurzer Texteingaben lassen sich ganze Briefe u. v. m. generieren. Durch die sogenannten Prompts können auch Bilder generiert werden, wie etwa Midjourney oder Dall-E von Open AI aufzeigen. Um jedoch Bilder anhand von Texteingaben erstellen zu können, müssen die KI-Tools mit einer Vielzahl an Bildern vorab trainiert werden. Hierzu werden Hunderte Millionen an Bildern benötigt. Nvidia hat nun ein neues KI-Bilderstellungstool vorgestellt, das gerade mal 100 KB groß ist und bei dem vier Minuten Training genügen.

Nvidia-KI: Mit "Key-Locking" sollen Bilder effizient erstellt werden

Nvidia setzt auf die neue Methode namens Perfusion, die gemeinsam mit der Tel-Aviv University entwickelt wurde. Zentral ist das Feature namens "Key-Locking". Hierbei wird immer der zentrale Oberbegriff, etwa Katze, in den Fokus des Bildes gestellt und zur Bilderstellung übergeordnete Kategorien gebildet. Wenn man etwa eine Katze zu einem Bild hinzufügen möchte, dann wird dies verknüpft mit einer breiteren "Vorstellung einer Katze". So werden verschiedene Interpretationen einer Katze im Kostüm ausgegeben. Um dennoch eindeutig als Katze erkannt zu werden, orientiert sich Nvidias KI an ein paar zentralen Punkten.

Im Gegensatz zu bisherigen KI-Tools werden die Bilder nicht isoliert gelernt, sondern in einen Kontext eingebettet. So können Nutzer bei Nvidias Tool den Bilderstellungsprozess durch Texteingabeaufforderungen leiten und mehrere Konzepte zusammenführen. So muss das KI-Tool nicht ständig neu trainiert werden, sodass sich der Speicherbedarf in Grenzen hält. Nvidia aktualisiert immer nur die Teile, die zur Feinabstimmung der Bilderzeugung benötigt werden, anstatt jedes Mal komplett neue Bilder zu erstellen.

Die Wissenschaftler geben zu, dass es manchmal zu Fehlinterpretationen kommen kann, da man sich bei den Prompts an ein Wort einer Oberkategorie halten muss. Angepasst wird immer auch nur ein 100-KB-Modell, sodass die Bildgröße wohl ebenfalls nicht riesig ausfällt. Aktuell gibt es lediglich das Forschungspapier zum KI-Tool, sodass man sich in Geduld üben muss, ehe man selbst Bilder via Nvidia-KI erstellen lassen kann. Bereits verfügbar ist etwa Midjourney oder Microsoft Bing mit Dall-E. Bei Adobe Photoshop steht mit Firefly noch in diesem Jahr ein KI-Tool zur Erstellung als Update parat. Zu beachten ist, dass die urheberrechtliche Frage oftmals unklar bleibt.

Ebenfalls lesenswert: Firefly: Adobe zeigt beeindruckende KI-Ergebnisse in Photoshop

Empfohlener redaktioneller Inhalt [EMBED_URL] An dieser Stelle finden Sie externe Inhalte von [PLATTFORM]. Zum Schutz Ihrer persönlichen Daten werden externe Einbindungen erst angezeigt, wenn Sie dies durch Klick auf "Alle externen Inhalte laden" bestätigen: Ich bin damit einverstanden, dass mir externe Inhalte angezeigt werden. Damit werden personenbezogene Daten an Drittplattformen übermittelt. Mehr dazu in unserer Datenschutzerklärung.
Externe Inhalte Mehr dazu in unserer Datenschutzerklärung.

Sammlung zu neuer Bilderstellungs-KI von Nvidia:

  • Nvidia hat gemeinsam mit der Tel-Aviv University eine neue Bilderstellungs-KI mit Perfusion entwickelt.
  • Zentral ist das Feature namens "Key-Locking". So werden immer nur die Teile, die zur Feinabstimmung der Bilderzeugung benötigt werden, anstatt jedes Mal komplett neue Bilder zu erstellen.
  • So soll der Speicherbedarf des KI-Tools bei 100 Kilobyte liegen und lediglich vier Minuten Training genügen.
  • Aktuell gibt es nur das Forschungspapier. Wann das KI-Tool getestet werden kann, ist noch offen.

Quelle: Decrypt

5
    • Kommentare (5)

      Zur Diskussion im Forum
      • Von T-MAXX Volt-Modder(in)
        Nvidia neues KI-Tool hätte man vor 40 Jahren gut gebrauchen können.
      • Von T-MAXX Volt-Modder(in)
        Nvidia neues KI-Tool hätte man vor 40 Jahren gut gebrauchen können.
      • Von nug4t Kabelverknoter(in)
        Ich verstehe immer nicht warum ihr am Ende nicht den Elefanten im Raum erwähnt. Immer wird das ausgelassen was wirklich ALLE benutzen gerade. SDXL mit comfy ui zb, oder sdxl mit webui1111, oder invokeai, oder neuerdings kadinsky 2.2
      • Von Waupee Software-Overclocker(in)
        Mhm hab noch nen paar Disketten hier rumliegen, laufwerke hab ich ja eh

        noch in meinen Retrokisten wäre doch mal was
      • Von VanWayne PC-Selbstbauer(in)
        Zitat von DoctorChandra
        Um so kleiner, um so teurer (in der Technik Welt).
        TV´s ausgenommen
        Wie meinst du das? Wenn das ein Scherz ist, fliegt der über mich hinweg.

        Es sollte dadurch ja um einiges günstiger werden. Wenn ich das noch richtig im Kopf habe (die eigentliche News ist schon ein bisschen älter), könnte das sogar eine 2060 locker schaffen.
      • Von DoctorChandra
        Um so kleiner, um so teurer (in der Technik Welt).
        TV´s ausgenommen
      Direkt zum Diskussionsende
  • Print / Abo
    Apps
    PCGH Magazin 07/2026 PC Games 07/2026 play5 07/2026 N-Zone 07/2026 Linux Magazin 07/2026 LinuxUser 07/2026 Raspberry Pi Geek 07/2026
    PC Games Hardware PC Games Linux Magazin Raspberry Pi Geek Computec Kiosk