"Ein Menschenleben am Tag": Nvidia soll für KI-Training heimlich Videos abgegriffen haben

21
News Norman Wittkopf Als bevorzugte Quelle auf Google hinzufügen
"Ein Menschenleben am Tag": Nvidia soll für KI-Training heimlich Videos abgegriffen haben
Quelle: Nvidia

Nvidia soll laut einem Leak heimlich Unmengen an Videos von verschiedenen Quellen für KI-Training abgegriffen haben, um so pro Tag den visuellen Gegenwert eines Menschenlebens zu erreichen.

Nachdem 404 Media kürzlich aufgedeckt hatte, dass ein KI-Startup illegale Inhalte auf Youtube genutzt hat, wurden jetzt Interna von Nvidia in Form von Slack-Nachrichten und E-Mails veröffentlicht, wonach das Unternehmen ebenfalls Videos von Youtube, Netflix und anderen Plattformen zum heimlichen KI-Training genutzt habe.

Das Ganze soll den Projektnamen "Cosmos" getragen haben und dem Bericht nach wurden Nvidia-Mitarbeiter angewiesen, Millionen von Videos mithilfe automatisierter Tools herunterzuladen. So sollten "Trainingsdaten im Wert einer visuellen Erfahrung eines Menschenlebens pro Tag" zusammengetragen werden, was bei einer angenommenen Lebensdauer von 80 Jahren (inklusive Schlaf) etwa 464.000 Stunden entsprechen würde, wie die Kollegen von Golem bezugnehmend berichten.

Die verwendeten Inhalte sollen beispielsweise von Film-Trailern bis hin zu selbst kreierten Videos von normalen Usern reichen. Mitarbeiter hätten darüber hinaus auch den Einsatz virtueller Maschinen diskutiert, um die Download-Beschränkungen von YouTube zu umgehen, und Filmmaterial aus Videospielen in Erwägung gezogen.

Manche Nvidia-Mitarbeiter hatten Bedenken

Einige Nvidia-Mitarbeiter hätten laut den veröffentlichten Konversationen aber auch Bedenken hinsichtlich Rechtmäßigkeit und Ethik der Verwendung urheberrechtlich geschützter Inhalte für das KI-Training gehabt, die jedoch oft von Projektmanagern abgetan worden sein sollen, da man eine "umfassende Genehmigung" von Führungskräften habe.

Das Unternehmen habe sein Vorgehen derweil dem Bericht nach damit erklärt, dass alles "in voller Übereinstimmung mit dem Wortlaut und dem Geist des Urheberrechts" stehe. Der Rechtfertigung nach schütze das Urheberrecht Ausdrucksformen, aber nicht Fakten oder Ideen, während die Verwendung der Daten zudem unter die "Faire Use"-Klausel für transformative Zwecke falle.

Ihre Meinung ist gefragt!

Was sagen Sie zu dem Nvidia-Leak? Nutzen Sie die Kommentarfunktion und teilen Sie uns Ihre Meinung mit. Zum Kommentieren müssten Sie auf PCGH.de oder im Extreme-Forum eingeloggt sein. Sollten Sie noch keinen Account haben, könnten Sie über eine Registrierung nachdenken, die viele Vorteile mit sich bringt. Beachten Sie beim Kommentieren aber bitte die gültigen Forenregeln.

21
    • Kommentare (21)

      Zur Diskussion im Forum
      • Von Cleriker Kokü-Junkie (m/w)
        Zitat von Neo1972
        Wenn es um Geld und Vorteil geht, ist sich jeder selbst der Nächste.
        Danke für dein unschönes Geständnis, aber ich nicht!
      • Von Cleriker Kokü-Junkie (m/w)
        Zitat von Neo1972
        Wenn es um Geld und Vorteil geht, ist sich jeder selbst der Nächste.
        Danke für dein unschönes Geständnis, aber ich nicht!
      • Von RyzA Flüssigstickstoff-Guru (m/w)
        Zitat von dushi
        kein Wunder, dass die KI so dämlich ist, wenn sie ihr Wissen aus Youtube und Filmtrailern saugt.
        Auf You Tube gibt es auch seriöse Kanäle - und Wissenschaftsvideos.

        Aber das wissen ja nicht mal manchen Menschen.
      • Von latiose88 BIOS-Overclocker(in)
        oder man macht es ganz extrem, man wirft alle seine sachen weg, gibt haus auf und zieht in eine Höhle und lebt darin und dann kann die ki auch nix mehr machen.
      • Von binär-11110110111 Software-Overclocker(in)
        Echt jetzt ? Woher hat wohl JEDE KI ihre UNMENGEN an Daten ??? Sie wurden ALLE mit öffentlich zugänglichen Inhalten trainiert, sogar die Open Source Variante Stable Diffusion samt ihrer unzähligen Checkpoints waren in Googel, Flickr, Getty Image und vielen anderen Bilderforen unterwegs.

        Also - Frage: Eine sehr gute KI brauch EXTREM viele Daten. Wie soll man sie füttern ???

        Und an die KI Hater: Hängt Euch einen Knoblauchkranz an die Tür und macht diese von innen zu !
      • Von PCGH_Torsten Kokü-Junkie (m/w)
        Zitat von binär-11110110111
        Naja, um einen brauchbaren Querschnitt zu bekommen, macht das durchaus Sinn. Wenn man sich mit KI strikt an Datenschutz halten würde und JEDEN Urheber erst fragen würde, gäbe es aktuell KEINE brauchbare KI, nicht mal im Ansatz. Wer damit ein Problem hat, sollte den Stecker ziehen und den Router schreddern. Einmal online, immer online.
        Wenn du dir ein neues Auto kaufst und zwei Jahre später wird das Keyless-Go-System gehackt: Musst du deinen Wagen dann auch shreddern um zu verhindern, dass dein Nachbar sich den Wagen regelmäßig für EInkaufstouren ausleiht, oder stellt das einen illegalen Einbruch dar? Den zu vermeiden weder deine Aufgabe wäre noch den du hättest durch nicht-kaufen vermeiden können, da es den Hack zum Zeitpunkt des Kaufs noch gar nicht gab?

        Genau so stehen Content-Produzenten vor "KI": Man hat vor Jahren etwas hochgeladen, gekoppelt an eine explizit eingeschränkte Nutzungslizenz. Eine Nutzung im übrigen, für die z.B. über Werbung angemessen bezahlt wurde. Jetzt kommt ein Konzern daher mit einem neuen Verwendungszweck, der in den alten Lizenzen nicht erlaubt war und in neueren sogar ausdrücklich verboten wird und der darauf hinausläuft, dass Content-Produktion dieser Art sogar ersetzt werden soll, und diesen Missbrauch seines Materials hat der Ersteller hinzunehmen? Gegen diese einseitige Aufhebung des Urheberrechts durch jemanden, der mit unbezahlter Nutzung fremder Inhalte Milliarden verdienen will, laufen derzeit nicht ohne Grund weltweit diverse Klagen.

        Zitat von Standeck
        Wie sollen wir das entscheiden?
        Nicht bei unseriösen KI-Anbietern, welche die Quelle ihrer Trainingsdaten nicht angeben können/wollen, kaufen respektive deren werbe- oder querfinanzierte Angebote nicht nutzen.
      Direkt zum Diskussionsende
  • Print / Abo
    Apps
    PCGH Magazin 07/2026 PC Games 06/2026 play5 07/2026 N-Zone 06/2026 Linux Magazin 06/2026 LinuxUser 06/2026 Raspberry Pi Geek 07/2026
    PC Games Hardware PC Games Linux Magazin Raspberry Pi Geek Computec Kiosk