ChatGPT kann jetzt "sehen, hören und sprechen"
Wie Hersteller OpenAI bekannt gegeben hat, kann die neue Version von ChatGPT sehen, hören und sprechen. Vorerst stehen die neuen Funktionen jedoch nur zahlenden Nutzern zur Verfügung.
Seit Anfang des Jahres ist ChatGPT in aller Munde. Mittels kurzer Texteingaben lassen sich ganze Briefe u.v.m. generieren. Beim KI-Tool von OpenAI ist unter anderem Microsoft seit 2019 einer der Großinvestoren. Mit einem optionalen Update wird der Windows Copilot auf Basis von ChatGPT voraussichtlich ab heute Abend in Windows 11 Version 22H2 Einzug halten. Später in diesem Jahr soll dann mit Windows 11 Version 23H2 jeder die Gelegenheit erhalten, das KI-Tool nutzen zu können. Wie OpenAI bekannt gegeben hat, kann die neueste Variante von ChatGPT "sehen, hören und sprechen".
Das sind die neuen Features von ChatGPT
In den nächsten zwei Wochen findet der gestaffelte Rollout der neuen Funktionen statt. Auf allen Plattformen wird es die Option zur Weiterverarbeitung von Bildern geben. Hierbei ist das neue ChatGPT in der Lage mittels Mustererkennung Text auf Fotos zu erkennen und kann so etwa auch bei Mathe-Problemen helfen, wenn man ein Foto der Aufgabe hochlädt. Speziell in den Apps auf iOS und Android kann ChatGPT auch sprechen. Auf Knopfdruck kann eine von fünf verschiedenen Stimmen die Antwort vorlesen. Zudem lässt sich mit dem KI-Bot sprechen. Alle neuen Funktionen stehen zunächst ausschließlich zahlenden Nutzern von ChatGPT Plus zur Verfügung. Die gesprochene Sprache der Nutzer wird "soweit dies nach geltendem Recht zulässig ist" verarbeitet, so Open AI. Für die Sprachausgabe hat Open AI direkt mit Sprechern zusammengearbeitet und keine Trainingsdatensätze aus dem Internet gezogen.
Zwar hält der Windows Copilot Einzug in Windows 11, doch innerhalb des Europäischen Wirtschaftsraumes kommt das KI-Tool vorerst nicht zu Windows, da die Vorschauversion nur in Nordamerika und Teilen von Asien und Südamerika verfügbar sein wird. Noch immer ist der Windows Copliot nur eine Vorschau. Microsoft weist darauf hin, dass gegebene Antworten inkorrekt sein können und von Menschen manuell überprüft werden sollten. Schließlich ist die KI nur ein Copilot. Abonnenten von Microsoft 365 können bald via KI-Copilot etwa Textvorschläge in Outlook erstellen lassen. Allerdings kostet die KI-Funktionen den Aufpreis von 30 US-Dollar monatlich. Innerhalb von Windows 11 gibt es die Funktion dagegen kostenfrei.
Ebenfalls lesenswert: Microsoft Copilot: KI-Assistent für Windows 11 hat einen Starttermin
Sammlung zu neuen Funktionen von ChatGPT:
- Open AI hat eine neue Version von ChatGPT angekündigt, die in den nächsten zwei Wochen ausgerollt wird.
- Speziell in den Apps auf iOS und Android kann ChatGPT auch sprechen. Neben der Sprachausgabe können Nutzer auch Fragen diktieren.
- Zudem kann mittels Mustererkennung Text auf Bildern erkannt werden und dann beispielsweise nach einer Lösung für eine mathematische Aufgabe gefragt werden.
- Alle neuen Features stehen zunächst nur zahlenden Nutzern von ChatGPT Plus zur Verfügung.
Quellen: OpenAI (1), OpenAI (2), Microsoft

).
[Ins Forum, um diesen Inhalt zu sehen]
Ich hab mal ChatGPT gefragt ob er mir mit ein paar Charakteren (Einhörner, Feen etc) eine Kindergeschichte schreibt, sie soll 1500 Wörter sein.
Die Geschichte war echt nett und er schreibt am Ende "sind exakt 1500 Wörter"
- Wirklich?
"Ja exakt 1500 Wörter"
- ich hab es gerade in Word kopiert, es sind keine 1500 Wörter
"oh entschuldige (blabla) ich habe nachgezählt es sind tatsächlich 647 Wörter.
Ok shcon gut, mach halt jetzt eine 1500 Wörter Geschichte draus, kannst ja noch eine Wendung einbauen.
Dasselbe nochmal.
Also frag ich: schreib mir eine Geschichte und zähl am Ende nochmal die Wörter
"es sind diesmal wirklich exakt 1500 Wörter"
-der Blitz soll dich beim Scheißen treffen, es sind wieder nur ca 600
"entschuldige bitte..." (selbe blabla)
Ich frag dann:
wäre es auf Englisch besser?
"ja, es könnte aufgrund der größeren Trainingsbasis mit Englisch durchaus besser funktionieren"
und was war? Exakt dasselbe. Ich habs dann auch mal mit 2500 Wörter usw probiert. Da kommen dann 800 Wörter dabei rum. Schon spannend.
Mal sehen wo die Reise hingeht.
Ich kann die oft generischen Dialoge in RPGs nicht hören, ich zappe da dann einfach durch. Wehe ein Spiel erlaubt das nicht. Aber wenn es tatsächlich live generierte Dialoge sein, die ihr "Wissen" aus der Spielewelt haben und auch auf aktuelle Geschehnisse eingehen, wär das schon spannend.
Nächste Stufen sind sowieso KI Support bei der Spieleentwicklung und natürlich sich verändernde Welten nach den Spielerhandlungen - ähnlich wie es damals Black and White sein wollte.
Mal sehen wo die Reise hingeht.