Neue Studie zeigt: Voice-Clones klingen menschlicher als gedacht

19
News Jacqueline Brosch Als bevorzugte Quelle auf Google hinzufügen
Neue Studie zeigt: Voice-Clones klingen menschlicher als gedacht
Quelle: erstellt mit ChatGPT

Eine aktuelle Studie zeigt auf: KI-Stimmen sind inzwischen kaum noch von echten Menschen zu unterscheiden. Forscher warnen vor Folgen für Sicherheit, Medien und Urheberrecht.

Künstliche Intelligenz soll laut einer aktuellen Untersuchung der Queen Mary University of London 2025 ein neues Realismusniveau in der Spracherzeugung erreicht haben. Die Forscher geben an, dass synthetische Stimmen kaum noch von echten Sprechern zu unterscheiden seien. Getestet wurden demnach sowohl vollständig generierte Stimmen als auch Klone realer Personen.

Nach Angaben der Autoren lag die Fehlerrate bei den Klonen bei über 50 Prozent. In 58 Prozent der Fälle hätten Testpersonen eine durch künstliche Intelligenz erzeugte Stimme für echt gehalten. Nur geringfügig mehr (62 Prozent) seien korrekt als menschlich erkannt worden. Der Unterschied sei statistisch kaum noch messbar. Während generische Stimmen weiterhin leicht künstlich wirkten, sollen Klone realer Sprecher inzwischen eine Qualität erreichen, die reale Aufnahmen nahezu ersetzt.

Die Forscher berichten, dass sie handelsübliche Tools verwendet haben, darunter Software von ElevenLabs. Bereits vier Minuten Audiomaterial hätten genügt, um eine Stimme detailgetreu nachzubilden, und zwar inklusive Tonfall, Pausen und Intonation. Laut Studie eröffnen solche Verfahren zwar neue Möglichkeiten, bergen aber auch erhebliche Risiken. Stimmen aus künstlicher Intelligenz könnten Anrufe, Interviews oder ganze Gespräche fälschen. Auch biometrische Systeme, die auf Sprachmuster setzen, ließen sich damit täuschen.

Auch Synchronsprecher Bodo Henkel (Xardas, Gothic) und Françoise Cadol (Lara Croft, Tomb Raider) haben sich öffentlich gegen künstlich erzeugte Nachbildungen ihrer Stimmen gewehrt. Die Forscher verweisen darauf, dass künstliche Stimmen künftig nicht nur in Unterhaltung, Werbung und Spielen, sondern auch in sicherheitsrelevanten Bereichen eine Rolle spielen könnten. Wie sich Authentizität und Schutz persönlicher Sprachdaten in Zukunft sichern lassen, bleibt vorerst offen.

Wie sollte mit künstlich erzeugten Stimmen künftig umgegangen werden? Nutzen Sie die Kommentarfunktion und teilen Sie uns Ihre Meinung mit. Beachten Sie beim Kommentieren aber bitte die Forenregeln. Folgen Sie uns außerdem für Neuigkeiten in der Hardware-Welt oder unsere exklusiven Inhalte gern auf Whatsapp und X. Unsere Video-Inhalte (oftmals gewürzt mit einer Prise Humor) finden Sie bei Youtube, Instagram und Tiktok.

Quelle: Pub Med Central via Livescience

19
    • Kommentare (19)

      Zur Diskussion im Forum
      • Von Gast1764587403
        Zitat von PCGH_Torsten
        Für Sprecher fühlt sich die GVL mitverantwortlich, aber der gesamte Nutzungskomplex als solcher ist neu. Da werden Gerichte viel Arbeit vor sich haben, in weit und wie altes Recht auf die Situation anwendbar ist. Historisch vergleichbare Prozesse liefen so langsam ab, dass rechtliche Regelungen mitwachsen konnten, aber diesmal dürfte es chaotisch werden.
        Ahja. GVL. Dann hab ich ja mal einen Ansatz zur Lektüre.

        Zitat von PCGH_Torsten
        Das ist unabhängig von der Kontoführung ist mir vor dir niemand begegnet, der seine Karte getrennt von anderen, immer mitzuführenden Objekten aufbewahrt. Entweder sie steckt mit Perso und Führerschein im Portmonee, oder aber sie ist sogar schon digital ins Smartphone eingebunden.
        Tatsächlich bin ich schon ziemlich darauf bedacht mit minimalst Balast auszugehen.
        Perso? Wie oft musstest du den bisher vorzeigen?
        Als Teenager wurde ich ständig nach einem gefragt. So im Alltag brauch ich den schon nicht. Für sonstige Sachen bei denen ich mich ausweisen muss, weiss ich vorher, dass ich ihn brauche.
        Den Rest brauch ich auch nicht täglich.
        Ich kenne einige die das genauso handhaben.
        Schlüsselbund, Autoschlüssel, Handy, Geldbeutel... Braucht man ja als Mann mittlerweile ne Handtasche.

        Zitat von PCGH_Torsten
        Muss vor den "flache Hand auf Tastenfeld"-Paketboten gewesen sein. Ich bin mittlerweile am überlegen, ob ich die Klingel an Tagen, an denen niemand erwartet wird, ganz abklemme.
        Mich haben Paketboten nie gestresst. Wir bestellen selbst auch viel.
        Hätte da einer über Maßen so eine Methode wie du sie beschreibst angewandt, hätte ich ihn eher überzeugt, bevor ich meine Klingel ausschalte.
      • Von Gast1764587403
        Zitat von PCGH_Torsten
        Für Sprecher fühlt sich die GVL mitverantwortlich, aber der gesamte Nutzungskomplex als solcher ist neu. Da werden Gerichte viel Arbeit vor sich haben, in weit und wie altes Recht auf die Situation anwendbar ist. Historisch vergleichbare Prozesse liefen so langsam ab, dass rechtliche Regelungen mitwachsen konnten, aber diesmal dürfte es chaotisch werden.
        Ahja. GVL. Dann hab ich ja mal einen Ansatz zur Lektüre.

        Zitat von PCGH_Torsten
        Das ist unabhängig von der Kontoführung ist mir vor dir niemand begegnet, der seine Karte getrennt von anderen, immer mitzuführenden Objekten aufbewahrt. Entweder sie steckt mit Perso und Führerschein im Portmonee, oder aber sie ist sogar schon digital ins Smartphone eingebunden.
        Tatsächlich bin ich schon ziemlich darauf bedacht mit minimalst Balast auszugehen.
        Perso? Wie oft musstest du den bisher vorzeigen?
        Als Teenager wurde ich ständig nach einem gefragt. So im Alltag brauch ich den schon nicht. Für sonstige Sachen bei denen ich mich ausweisen muss, weiss ich vorher, dass ich ihn brauche.
        Den Rest brauch ich auch nicht täglich.
        Ich kenne einige die das genauso handhaben.
        Schlüsselbund, Autoschlüssel, Handy, Geldbeutel... Braucht man ja als Mann mittlerweile ne Handtasche.

        Zitat von PCGH_Torsten
        Muss vor den "flache Hand auf Tastenfeld"-Paketboten gewesen sein. Ich bin mittlerweile am überlegen, ob ich die Klingel an Tagen, an denen niemand erwartet wird, ganz abklemme.
        Mich haben Paketboten nie gestresst. Wir bestellen selbst auch viel.
        Hätte da einer über Maßen so eine Methode wie du sie beschreibst angewandt, hätte ich ihn eher überzeugt, bevor ich meine Klingel ausschalte.
      • Von PCGH_Torsten Kokü-Junkie (m/w)
        Zitat von szakal23
        Ist offensichtlich das es dies bisher nicht gab.
        Aber mal angenommen, wie gesagt ohne Kenntnis über die Verträge zu haben, dass die Beauftragung mit einschloss, dass die Rechte an der Vertonung, samt der weiteren, im Vertrag nicht besonders detailreich ausgeführten, sondern als allgemein bezeichneten Verwendungen beim Auftraggeber liegen und diese Rechte somit inbegreifen, dass dieser die Aufzeichnungen mit allem was mit der Marke in Verbindung stehenden Zwecke, nutzen darf wie er sie möchte:
        Dann würde das Recht ja nicht außerkraft treten, weil sich die Technik weiter entwickelt hat.

        Zum Zeitpunkt hätte man sich vielleicht gedacht, dass der Auftraggeber beliebig schneiden darf und die Aufnahmen z.B. auch unbegrenzt für Trailer und Remaster verwenden darf.
        Und die heutige Realität wäre dann aber, dass für die Vertonung einer Fortsetzung, der Sprecher nicht mehr notwendig ist, die alten Aufnahmen fürs Training genutzt wurden und das Ergebnis ihn nun ersetzt haben.

        Oder gibt's ne GEMA für Synchronstimmen?
        Für Sprecher fühlt sich die GVL mitverantwortlich, aber der gesamte Nutzungskomplex als solcher ist neu. Da werden Gerichte viel Arbeit vor sich haben, in weit und wie altes Recht auf die Situation anwendbar ist. Historisch vergleichbare Prozesse liefen so langsam ab, dass rechtliche Regelungen mitwachsen konnten, aber diesmal dürfte es chaotisch werden.

        Zitat
        Wird vielleicht plausibler wenn aus der Freundin die Ehefrau wird und nur ein Konto geführt wird.
        Das ist unabhängig von der Kontoführung ist mir vor dir niemand begegnet, der seine Karte getrennt von anderen, immer mitzuführenden Objekten aufbewahrt. Entweder sie steckt mit Perso und Führerschein im Portmonee, oder aber sie ist sogar schon digital ins Smartphone eingebunden. Wenn man das dann verbummelt, wird selten das Pendant des Partners bereitliegen und anrufen wird auch schwierig. (Davon abgesehen sollte man sich tatsächlich nicht darauf verlassen, einen Redakteur in genau dem Moment binnen Sekunden zu erreichen, in dem man an der Kasse steht. Calls, Video-Drehs, Testsysteme – es gibt viele Gründe, warum ich einen Anruf gegebenenfalls nicht entgegennehme. In der Praxis schickt mir meine Freundin eher eine Textnachricht. Nicht um mich nach meiner Pin zu fragen, sondern um mir zu sagen, was ich mitbringen soll, während sie, mit multiplen Zahlungsmöglichkeiten zur Hand, auf der Couch liegt.)

        Zitat
        Hab mal in Wohnungen in Mehrfamilienhäusern gewohnt. War auch mal ein größerer Block dabei.
        Sprechanlage. Keine Videosprechanlage. Also wenn da Familie unten klingelt, betätigte ich (Trommelwirbel) nur anhand der Stimme die ich im Apperat hörte den Summer. Die Wohnungseingangstür ließ ich offen stehen und setzte mich halt wieder da hin wo ich zuvor war oder ging meiner Tätigkeit nach die ich bis dahin ausübte. Ohne dabei wie ein Hündchen an der Tür zu warten.
        Lebensgefährlich. Ich weiss.
        Muss vor den "flache Hand auf Tastenfeld"-Paketboten gewesen sein. Ich bin mittlerweile am überlegen, ob ich die Klingel an Tagen, an denen niemand erwartet wird, ganz abklemme.
      • Von DarkWing13 BIOS-Overclocker(in)
        Da kann ich nur hoffen, das dies auch bald auf YT Einzug hält.
        "Automatisch übersetzt" ist einfach nur furchtbar!
        Vor kurzem hatte ich ein ein Video aufgerufen bei dem YT mal wieder dachte es wäre "intelligent" mir eine Übersetzung zu liefern (normalerweise höre ich das englische Original), bei der doch tatsächlich die Stimme einer weiblichen Sprecherin durch eine männliche ersetzt wurde....wahrscheinlich war ihre Stimme zu tief.
        Zitat von restX3
        Die Porno-Industrie wird ihren zweiten Frühling bekommen.
        Das war doch noch nie nötig...oh ja/yes, oh god/Gott, oh...
        War schon immer Multilingual....
      • Von restX3 BIOS-Overclocker(in)
        Die Porno-Industrie wird ihren zweiten Frühling bekommen.
      • Von Gast1764587403
        Zitat von PCGH_Torsten
        Bislang war Urheberschutz für eine Stimme schlicht kein Thema. Man kann natürlich auch damit künstlerisch-schöpfend aktiv sein, aber selbst Musiker schützen meinem Wissen nach nur Melodien und Texte. Daher hättest du bislang für die Originalaufnahme des Yippie-Ki-Yay zu 20th Century Fox gehen müssen, aber Jippie-Kei-Jäy von Manfred Lehmann neu einsprechen lassen? Warum nicht? Im Worst Case ist bei diesem Kunstwort tatsächlich die Phrase geschützt, aber alle anderen Worte wären okay. Der Klang, die Aussprache, die Stimme, die Performance als solche war nie Gegenstand von Rechtsverhandlungen. Das gilt umgekehrt dann aber halt auch für den Publisher, der mit Aufnahme eine KI trainieren will.
        Ist offensichtlich das es dies bisher nicht gab.
        Aber mal angenommen, wie gesagt ohne Kenntnis über die Verträge zu haben, dass die Beauftragung mit einschloss, dass die Rechte an der Vertonung, samt der weiteren, im Vertrag nicht besonders detailreich ausgeführten, sondern als allgemein bezeichneten Verwendungen beim Auftraggeber liegen und diese Rechte somit inbegreifen, dass dieser die Aufzeichnungen mit allem was mit der Marke in Verbindung stehenden Zwecke, nutzen darf wie er sie möchte:
        Dann würde das Recht ja nicht außerkraft treten, weil sich die Technik weiter entwickelt hat.

        Zum Zeitpunkt hätte man sich vielleicht gedacht, dass der Auftraggeber beliebig schneiden darf und die Aufnahmen z.B. auch unbegrenzt für Trailer und Remaster verwenden darf.
        Und die heutige Realität wäre dann aber, dass für die Vertonung einer Fortsetzung, der Sprecher nicht mehr notwendig ist, die alten Aufnahmen fürs Training genutzt wurden und das Ergebnis ihn nun ersetzt haben.

        Oder gibt's ne GEMA für Synchronstimmen?

        Zitat von PCGH_Torsten
        Bezüglich deiner Zweifaktorüberlegungen kann ich leider keines der Szenarien nachvollziehen. Erst vergesse ich mein Portmonee, dann verschlampt meine Freundin ihres, dann sucht und findet sie meins, obwohl sie davon ausgehen musste, ich habe es dabei und geht damit einkaufen und zu guter Letzt übersteigt der Einkauf die enthaltene Bargeldmenge, aber zum Glück hat sie ihr Handy dabei, geladen und ich bin auf Arbeit erreichbar? Da gibt es nur eine Antwort: "Bring einen Lottoschein mit. Ziffern sind egal, es werden die richtigen sein."
        Wird vielleicht plausibler wenn aus der Freundin die Ehefrau wird und nur ein Konto geführt wird.
        Und Bargeld, gibts im meinem Geldbeutel tatsächlich nicht mehr.
        Suchen müsste sie es nicht, da es zugänglich auf der Kommode liegt und ich das auch nicht immer mit mir führe.
        Also auch bei näherer Betrachtung kommt mir dieses Verhalten nicht so exotisch vor, als dass es nicht auch einige andere so handhaben.
        So persönliches Eigentum in einer Ehe, ist auch gar nicht mehr nur das eigene Eigentum. Verschmilzt alles so bisschen. Mann hat weniger, aber das ist wahrscheinlich auch interessenbedingt.
        Du bist auf Arbeit nicht erreichbart? Oh. Na dann. Ok.

        Zitat von PCGH_Torsten
        Von dem Gewinn kann man sich dann auch einen Türspion leisten, um nicht mehr x-beliebige Leute nach der Stimme reinlassen zu müssen.
        Hab mal in Wohnungen in Mehrfamilienhäusern gewohnt. War auch mal ein größerer Block dabei.
        Sprechanlage. Keine Videosprechanlage. Also wenn da Familie unten klingelt, betätigte ich (Trommelwirbel) nur anhand der Stimme die ich im Apperat hörte den Summer. Die Wohnungseingangstür ließ ich offen stehen und setzte mich halt wieder da hin wo ich zuvor war oder ging meiner Tätigkeit nach die ich bis dahin ausübte. Ohne dabei wie ein Hündchen an der Tür zu warten.
        Lebensgefährlich. Ich weiss.
      Direkt zum Diskussionsende
  • Print / Abo
    Apps
    PCGH Magazin 07/2026 PC Games 06/2026 play5 07/2026 N-Zone 06/2026 Linux Magazin 06/2026 LinuxUser 06/2026 Raspberry Pi Geek 07/2026
    PC Games Hardware PC Games Linux Magazin Raspberry Pi Geek Computec Kiosk