ChatGPT kann jetzt "sehen, hören und sprechen"

10
News Claus Ludewig Als bevorzugte Quelle auf Google hinzufügen
ChatGPT kann jetzt "sehen, hören und sprechen"
Quelle: Pexels.com

Wie Hersteller OpenAI bekannt gegeben hat, kann die neue Version von ChatGPT sehen, hören und sprechen. Vorerst stehen die neuen Funktionen jedoch nur zahlenden Nutzern zur Verfügung.

Seit Anfang des Jahres ist ChatGPT in aller Munde. Mittels kurzer Texteingaben lassen sich ganze Briefe u.v.m. generieren. Beim KI-Tool von OpenAI ist unter anderem Microsoft seit 2019 einer der Großinvestoren. Mit einem optionalen Update wird der Windows Copilot auf Basis von ChatGPT voraussichtlich ab heute Abend in Windows 11 Version 22H2 Einzug halten. Später in diesem Jahr soll dann mit Windows 11 Version 23H2 jeder die Gelegenheit erhalten, das KI-Tool nutzen zu können. Wie OpenAI bekannt gegeben hat, kann die neueste Variante von ChatGPT "sehen, hören und sprechen".

Das sind die neuen Features von ChatGPT

In den nächsten zwei Wochen findet der gestaffelte Rollout der neuen Funktionen statt. Auf allen Plattformen wird es die Option zur Weiterverarbeitung von Bildern geben. Hierbei ist das neue ChatGPT in der Lage mittels Mustererkennung Text auf Fotos zu erkennen und kann so etwa auch bei Mathe-Problemen helfen, wenn man ein Foto der Aufgabe hochlädt. Speziell in den Apps auf iOS und Android kann ChatGPT auch sprechen. Auf Knopfdruck kann eine von fünf verschiedenen Stimmen die Antwort vorlesen. Zudem lässt sich mit dem KI-Bot sprechen. Alle neuen Funktionen stehen zunächst ausschließlich zahlenden Nutzern von ChatGPT Plus zur Verfügung. Die gesprochene Sprache der Nutzer wird "soweit dies nach geltendem Recht zulässig ist" verarbeitet, so Open AI. Für die Sprachausgabe hat Open AI direkt mit Sprechern zusammengearbeitet und keine Trainingsdatensätze aus dem Internet gezogen.

Zwar hält der Windows Copilot Einzug in Windows 11, doch innerhalb des Europäischen Wirtschaftsraumes kommt das KI-Tool vorerst nicht zu Windows, da die Vorschauversion nur in Nordamerika und Teilen von Asien und Südamerika verfügbar sein wird. Noch immer ist der Windows Copliot nur eine Vorschau. Microsoft weist darauf hin, dass gegebene Antworten inkorrekt sein können und von Menschen manuell überprüft werden sollten. Schließlich ist die KI nur ein Copilot. Abonnenten von Microsoft 365 können bald via KI-Copilot etwa Textvorschläge in Outlook erstellen lassen. Allerdings kostet die KI-Funktionen den Aufpreis von 30 US-Dollar monatlich. Innerhalb von Windows 11 gibt es die Funktion dagegen kostenfrei.

Ebenfalls lesenswert: Microsoft Copilot: KI-Assistent für Windows 11 hat einen Starttermin

Empfohlener redaktioneller Inhalt [EMBED_URL] An dieser Stelle finden Sie externe Inhalte von [PLATTFORM]. Zum Schutz Ihrer persönlichen Daten werden externe Einbindungen erst angezeigt, wenn Sie dies durch Klick auf "Alle externen Inhalte laden" bestätigen: Ich bin damit einverstanden, dass mir externe Inhalte angezeigt werden. Damit werden personenbezogene Daten an Drittplattformen übermittelt. Mehr dazu in unserer Datenschutzerklärung.
Externe Inhalte Mehr dazu in unserer Datenschutzerklärung.

Sammlung zu neuen Funktionen von ChatGPT:

  • Open AI hat eine neue Version von ChatGPT angekündigt, die in den nächsten zwei Wochen ausgerollt wird.
  • Speziell in den Apps auf iOS und Android kann ChatGPT auch sprechen. Neben der Sprachausgabe können Nutzer auch Fragen diktieren.
  • Zudem kann mittels Mustererkennung Text auf Bildern erkannt werden und dann beispielsweise nach einer Lösung für eine mathematische Aufgabe gefragt werden.
  • Alle neuen Features stehen zunächst nur zahlenden Nutzern von ChatGPT Plus zur Verfügung.

Quellen: OpenAI (1), OpenAI (2), Microsoft

10
    • Kommentare (10)

      Zur Diskussion im Forum
      • Von Schnitzelnator Software-Overclocker(in)
        Nice, das werde ich dann bald mal testen. Vielleicht schaffe ich in meinem Leben doch noch alles, was ich vor hatte. Vor ChatGPT hatte ich damit eigentlich schon abgeschlossen (mit dem Vorhaben, nicht mit dem Leben ).
      • Von Schnitzelnator Software-Overclocker(in)
        Nice, das werde ich dann bald mal testen. Vielleicht schaffe ich in meinem Leben doch noch alles, was ich vor hatte. Vor ChatGPT hatte ich damit eigentlich schon abgeschlossen (mit dem Vorhaben, nicht mit dem Leben ).
      • Von Titanultra Software-Overclocker(in)
        Echt cool das Tool.
      • Von Neuer_User BIOS-Overclocker(in)
        Zitat von chill_eule
        Kann ich schon lange!
        Wir älteren sind da auch recht bewandert, die jüngeren Jahrgänge machen immer mehr Probleme. Da muss dann die KI einspringen
        [Ins Forum, um diesen Inhalt zu sehen]
      • Von Rollora Kokü-Junkie (m/w)
        Zitat von chill_eule
        Kann ich schon lange!
        Du kannst aber nicht so gut Bullshitten.
        Ich hab mal ChatGPT gefragt ob er mir mit ein paar Charakteren (Einhörner, Feen etc) eine Kindergeschichte schreibt, sie soll 1500 Wörter sein.
        Die Geschichte war echt nett und er schreibt am Ende "sind exakt 1500 Wörter"

        - Wirklich?
        "Ja exakt 1500 Wörter"
        - ich hab es gerade in Word kopiert, es sind keine 1500 Wörter
        "oh entschuldige (blabla) ich habe nachgezählt es sind tatsächlich 647 Wörter.

        Ok shcon gut, mach halt jetzt eine 1500 Wörter Geschichte draus, kannst ja noch eine Wendung einbauen.

        Dasselbe nochmal.

        Also frag ich: schreib mir eine Geschichte und zähl am Ende nochmal die Wörter
        "es sind diesmal wirklich exakt 1500 Wörter"
        -der Blitz soll dich beim Scheißen treffen, es sind wieder nur ca 600
        "entschuldige bitte..." (selbe blabla)
        Ich frag dann:
        wäre es auf Englisch besser?
        "ja, es könnte aufgrund der größeren Trainingsbasis mit Englisch durchaus besser funktionieren"

        und was war? Exakt dasselbe. Ich habs dann auch mal mit 2500 Wörter usw probiert. Da kommen dann 800 Wörter dabei rum. Schon spannend.
        Zitat von PCTom
        Wiederstand ist zwecklos, Ihr werdet Chat GPTt!
        Mal sehen wo die Reise hingeht.
        Interessant wäre sowas tatsächlich in RPGs.
        Ich kann die oft generischen Dialoge in RPGs nicht hören, ich zappe da dann einfach durch. Wehe ein Spiel erlaubt das nicht. Aber wenn es tatsächlich live generierte Dialoge sein, die ihr "Wissen" aus der Spielewelt haben und auch auf aktuelle Geschehnisse eingehen, wär das schon spannend.
        Nächste Stufen sind sowieso KI Support bei der Spieleentwicklung und natürlich sich verändernde Welten nach den Spielerhandlungen - ähnlich wie es damals Black and White sein wollte.
      • Von PCTom Volt-Modder(in)
        Wiederstand ist zwecklos, Ihr werdet Chat GPTt!
        Mal sehen wo die Reise hingeht.
      Direkt zum Diskussionsende
  • Print / Abo
    Apps
    PCGH Magazin 08/2026 PC Games 07/2026 play5 08/2026 N-Zone 07/2026 Linux Magazin 07/2026 LinuxUser 07/2026 Raspberry Pi Geek 07/2026
    PC Games Hardware PC Games Linux Magazin Raspberry Pi Geek Computec Kiosk