Mit ChatGPT: Microsoft schraubt an neuer Bilderstellungs-KI
Entwickler von Microsoft arbeiten derzeit an einer neuen KI zur Bilderstellung, die mehr zu bieten hat als etwa Dall-E. Das neue Visual ChatGPT integriert das KI-Tool von Open AI.
Mit Dall-E vom Hersteller Open AI lassen sich Zeichnungen erstellen. In Verbindung mit einem Abonnement von Microsoft 365 kann im Microsoft Designer neue Bilder erstellt und dann exportiert werden. Durch die Eingabe von Begriffen wird dann ein Bild erzeugt, das in sozialen Netzwerken, Word, Powerpoint und Co. geteilt werden kann. Generierte Bilder lassen sich auf create.microsoft.com hoch- und herunterladen. Nun werkeln Microsoft-Entwickler bereits an einem neuen KI-Tool zur Bilderstellung, wobei ChatGPT von Open AI die Grundlage bildet.
Was unterscheidet Visual ChatGPT von Dall-E?
Analog zum Textgenerator können Nutzer von Visual ChatGPT Gespräche mit der KI führen und sich dann ein Bild erstellen lassen. So schreibt man einen Befehl und die KI erstellt daraus dann ein Bild. Es ist sogar möglich, Nachfragen zu stellen. So können Nutzer nachträglich das generierte Bild verändern lassen. Eine derartige Bearbeitungsfunktion bietet Dall-E nicht, hier muss man immer ein komplett neues Bild erstellen lassen. Bei Visual ChatGPT wird ChatGPT kombiniert mit Visual-Foundation-Modellen wie Blip oder Stable Difussion. Ein eigener Prompt Manager bestimmt im Hintergrund, welcher Bildgenerator gerade am besten zur Erstellung geeignet ist. Visual ChatGPT kann auch auf Fragen antworten, etwa "Welche Farbe hat die Wand in diesem Bild?".
Microsofts Forschungsteam stellt die Vorschau-Version von Visual ChatGPT kostenfrei auf Github zur Verfügung. Aktuell benötigt das Programm jedoch bis zu 7 GiByte VRAM für einzelne Komponenten, sodass eine Grafikkarte empfehlenswert ist. Noch unklar ist, wie Microsoft das neue KI-Tool einsetzen wird. Eventuell erfährt man hierzu etwas auf einem Online-Event rund um Office und KI am Donnerstag, dem 16. März, ab 17 Uhr deutscher Zeit. Im Bereich des Möglichen erscheint etwa die Bildersuche von Bing. Seit Februar können registrierte Betatester das neue Bing mit integriertem ChatGPT testen. Laut Microsoft hat das dazu geführt, dass erstmals in der Geschichte der Microsoft-Suchmaschine mehr als 100 Millionen aktive Nutzer pro Monat Bing benutzt haben.
Ebenfalls lesenswert: Update für Windows 11: Bing mit ChatGPT kommt in die Taskleiste
Sammlung zu neuer Bilderstellungs-KI mit ChatGPT:
- Microsoft-Entwickler arbeiten an einem neuen Bilderstellungstool mit ChatGPT.
- Nutzer können einen Text eingeben und das KI-Tool erstellt daraus dann ein Bild. Im Gegensatz zu bereits bestehenden KI-Bildgeneratoren wie Dall-E, kann das neue Visual ChatGPT auch nachträglich Änderungen an einem Bild vornehmen.
- Visual ChatGPT kann auch auf Fragen antworten, etwa "Welche Farbe hat die Wand in diesem Bild?".
- Es gibt bereits eine Preview-Version von Visual ChatGPT kostenlos auf Github. Noch ist unklar, wann das Tool fertig ist.

Ich versuche beispielsweise mein Pen&Paper-Projekt mit KI zu illustrieren, aber wenn man versucht irgendeine Fantasy-Kultur mit immer gleicher Optik in verschiedenen Szenarien zu erzeugen, kommt KI noch an ihre Grenzen. Ohne Photoshop ist das aktuell sehr nervenzehrend.
Wenn man jetzt nachbessern kann, erleichtert das sicher vieles. "Jetzt zeige das gleiche Wesen beim Reiten" beispielsweise.
Bin gespannt das später mal ausprobieren zu können.