Dall-E: Sicherheitskonzept des KI-Bildgenerators geleakt

1
News Claus Ludewig Als bevorzugte Quelle auf Google hinzufügen
Dall-E: Sicherheitskonzept vom KI-Bildgenerator geleakt
Quelle: Mit KI erstellt (Dall-E 3 per ChatGPT)

Um zu verhindern, dass bestimmte Inhalte erstellt werden, gibt es eine Art Regelwerk für KI-Tools. Nun ist das Sicherheitskonzept hinter Dall-E geleakt worden.

Am 20. Oktober gab Open AI bekannt, dass der KI-Bildgenerator Dall-E 3 innerhalb von ChatGPT verfügbar ist. Wie üblich steht das Feature ausschließlich zahlenden Kunden von ChatGPT Plus zur Verfügung. Um keine Urheberrechtsverletzungen zu riskieren oder die Darstellung nicht jugendfreier oder ethisch fragwürdiger Inhalte zu verhindern, gibt es ein Sicherheitskonzept laut Hersteller Open AI. Nun ist das Sicherheitskonzept hinter dem Bildgenerator geleakt worden, wie KI-Forscher herausgefunden haben.

Grenzen von Dall-E 3

Wie bei jeder bislang üblichen generativen KI-Tool müssen Grenzen dem System extern definiert werden. Durch gezielte Prompt Injection kann man diese Beschränkungen festlegen. Laut Leaks ist es Dall-E verboten, Bilder von Prominenten oder Politikern zu erstellen. Wie Simon Willison schreibt, ist die Definition der Grenzen sehr weit fortgeschritten bei Dall-E 3. So wurde auch daran gedacht, dass sich keine Bilder mit VIPs erstellen lassen, selbst wenn etwa deren Name falsch buchstabiert wurde. Wenn es nach Open AI geht, sollen auch Urheberrechte berücksichtigt werden. So soll es keine direkten Referenzen zu Künstlern geben. Zudem darf die KI nur Kunstwerke zitieren, die über 100 Jahre alt sind. Das System prüft jede Eingabeaufforderung und die daraus erstellten Bilder, um etwa nicht jugendfreie Inhalte zu verhindern. Ergänzend können Anwender problematische Ergebnisse melden und damit das Modell weiterentwickeln.

Bislang waren vor allem Hände problematisch bei KI-Bildgeneratoren. Die dritte Iteration von Dall-E soll nun auch Bilder mit Händen und Gesichter ohne Fehler erzeugen können. Wie üblich bei KI-Tools gilt, dass diese erst mit der Zeit durch jede getätigte Eingabe besser werden. Laut Hersteller gibt es auch ein neues Tool zur Herkunftsbestimmung, mit dem sich zu rund 99 Prozent Trefferquote sagen lässt, ob ein Bild von einer KI erstellt wurde. Neben ChatGPT lässt sich Dall-E auch kostenfrei mit Microsoft Bing nutzen, vorausgesetzt man ist mit einem Microsoft-Konto angemeldet. In Microsoft 365 lässt sich die Technik von Open AI ebenfalls nutzen.

Ebenfalls lesenswert: Apple: Kommt 2024 der KI-Aufschlag in iOS 18 und weiteren Produkten? [Gerücht]

Empfohlener redaktioneller Inhalt [EMBED_URL] An dieser Stelle finden Sie externe Inhalte von [PLATTFORM]. Zum Schutz Ihrer persönlichen Daten werden externe Einbindungen erst angezeigt, wenn Sie dies durch Klick auf "Alle externen Inhalte laden" bestätigen: Ich bin damit einverstanden, dass mir externe Inhalte angezeigt werden. Damit werden personenbezogene Daten an Drittplattformen übermittelt. Mehr dazu in unserer Datenschutzerklärung.
Externe Inhalte Mehr dazu in unserer Datenschutzerklärung.

Sammlung zum Sicherheitskonzept hinter Dall-E 3 von Open AI:

  • Seit 20. Oktober ist der KI-Bildgenerator Dall-E 3 innerhalb von ChatGPT verfügbar. Zumindest, wenn man ein zahlender Kunde von ChatGPT Plus ist.
  • Inzwischen ist das Sicherheitskonzept geleakt worden, schließlich muss sich Dall-E an einige Regeln halten.
  • So ist es nicht möglich, Bilder von Prominenten oder Politikern zu erstellen.
  • Zudem darf es keine direkten Zitate von lebenden Künstlern geben.
  • Auch nicht jugendfreie Inhalte können nicht erstellt werden.

Quelle: Simon Willison

1
    • Kommentare (1)

      Zur Diskussion im Forum
      • Von Schnitzelnator Software-Overclocker(in)
        Manches was im Sicherheitskonzept, bzw. dem Artikel, geschrieben wurde, ist nicht ganz korrekt ausgedrückt.
        Alles, was zu verhindern versucht wurde, ist durch den Nutzer erreichbar. Es ist nur erschwert dadurch, dass das Modell angewiesen wurde, es nicht zu tun. Selbstverständlich kann jemand das Modell zu Dingen überreden oder es austricksen, so wie sich jeder Mensch überreden oder austricksen lässt. Das KI Modell ist sogar erheblich dümmer in der Erkennung, ob es manipuliert wird, weil es gar keine Gefühle hat, und somit nicht spüren kann, ob es etwas tut, was es nicht sollte.
      • Von Schnitzelnator Software-Overclocker(in)
        Manches was im Sicherheitskonzept, bzw. dem Artikel, geschrieben wurde, ist nicht ganz korrekt ausgedrückt.
        Alles, was zu verhindern versucht wurde, ist durch den Nutzer erreichbar. Es ist nur erschwert dadurch, dass das Modell angewiesen wurde, es nicht zu tun. Selbstverständlich kann jemand das Modell zu Dingen überreden oder es austricksen, so wie sich jeder Mensch überreden oder austricksen lässt. Das KI Modell ist sogar erheblich dümmer in der Erkennung, ob es manipuliert wird, weil es gar keine Gefühle hat, und somit nicht spüren kann, ob es etwas tut, was es nicht sollte.
      Direkt zum Diskussionsende
  • Print / Abo
    Apps
    PCGH Magazin 07/2026 PC Games 07/2026 play5 07/2026 N-Zone 07/2026 Linux Magazin 07/2026 LinuxUser 07/2026 Raspberry Pi Geek 07/2026
    PC Games Hardware PC Games Linux Magazin Raspberry Pi Geek Computec Kiosk