ChatGPT integriert KI-Bildgenerator Dall-E 3
Wie Open AI erklärt, lassen sich ab sofort Bilder mittels Dall-E 3 in ChatGPT generieren. Hierbei sollen die erstellten Bilder besser als bislang sein.
Am 26. September gab Open AI bekannt, dass die neue Version von ChatGPT "sehen, hören und sprechen" kann. Auf Knopfdruck kann eine von fünf verschiedenen Stimmen die Antwort vorlesen. Zudem lässt sich mit dem KI-Bot sprechen. Zudem lassen sich erstellte Bilder weiterbearbeiten. Alle neuen Funktionen stehen zunächst ausschließlich zahlenden Nutzern von ChatGPT Plus zur Verfügung. Nun gibt der Hersteller bekannt, dass der KI-Bildgenerator Dall-E 3 innerhalb von ChatGPT verfügbar ist. Wie üblich steht das Feature ausschließlich zahlenden Kunden von ChatGPT Plus zur Verfügung.
Grenzen von Dall-E 3
Bislang waren vor allem Hände problematisch bei KI-Bildgeneratoren. Die dritte Iteration von Dall-E soll nun auch Bilder mit Händen und Gesichter ohne Fehler erzeugen können. Wie üblich bei KI-Tools gilt, dass diese erst mit der Zeit durch jede getätigte Eingabe besser werden. Laut Hersteller gibt es auch ein neues Tool zur Herkunftsbestimmung, mit dem sich zu rund 99 Prozent Trefferquote sagen lässt, ob ein Bild von einer KI erstellt wurde.
Dall-E 3 kann keine Bilder im Stil lebender Künstler erstellen. Zudem prüft das System jede Eingabeaufforderung und die daraus erstellten Bilder, um etwa nicht jugendfreie Inhalte zu verhindern. Ergänzend können Anwender problematische Ergebnisse melden und damit das Modell weiterentwickeln. OpenAI hat jüngst bekannt gegeben, dass mit ChatGPT und Co. pro Monat 80 Mio. US-Dollar generiert werden. Der Betrieb der Server mit 285.000 CPU-Kernen und 10.000 Grafikkarten verursacht dennoch hohe Kosten. In kommenden PCs mit Intel Core Ultra sollen sich KI-Features durch die NPU lokal beschleunigen lassen, wie das heute bereits bei einigen Smartphones und Apple MacBooks mit M-Chip der Fall ist. Neben ChatGPT setzt auch die Bing-KI von Microsoft auf die gleiche Technik von Open AI.
Ebenfalls lesenswert: ChatGPT kann jetzt "sehen, hören und sprechen"
Sammlung zu Dall-E in ChatGPT:
- Wie Hersteller Open AI bekannt gegeben hat, steht ab sofort der KI-Bildgenerator Dall-E 3 innerhalb von ChatGPT zur Verfügung. Das Feature kann nur von zahlenden Kunden von ChatGPT Plus genutzt werden.
- Die dritte Iteration von Dall-E soll nun auch Bilder mit Händen und Gesichter ohne Fehler erzeugen können und somit eine Schwachstelle bei KI-generierten Bildern beheben,
- Ein System prüft jede Nutzereingabe und die daraus erstellten Bilder, um nicht jugendfreie Bilder zu verhindern.
Quelle: Open AI

[Ins Forum, um diesen Inhalt zu sehen]
Edit:
[Ins Forum, um diesen Inhalt zu sehen]
Edit2: OK, zugegeben: Es ist etwas doof, das Handy auf den Bildschirm rechts zu richten, und Fotos davon zu machen, während man erstaunt auf den Rechner glotzt. Und vielleicht auch nicht so schlau, den Finger auf die Kameralinse zu knallen. Aber eigentlich ist es erstaunlich, wie wenige Fehler DALL-E macht.
Edit3: Was die Zensur angeht, muss ich auch sagen, dass das Gefühl habe, dass DALL-E eher ungern Frauen generiert, und Bilder mit Frauen oft "gegen die Richtlinien verstoßen". Da scheint schon recht wenig unbekleidete Haut auszureichen. Wenn man bemäkelt, dass das nicht fair ist, scheint es doch auch eher Frauen zu integrieren. Eventuell muss OpenAI da nochmal was nachbessern, weil wenn überhaupt können Bilder mit Männern und Frauen jeweils nur gleich stark gegen die Richtlinien verstoßen, je nachdem, was dargestellt ist, und kein Geschlecht generell stärker als das andere.
Da lob ich mir die Stable Diffusion clients die keine Limitierungen haben.