Beunruhigend: Künstliche Intelligenz findet Standort über Fotos [Bericht]
Eine Künstliche Intelligenz namens "PIGEON" ist dazu in der Lage, allein anhand eines Fotos den jeweiligen Standort mit beeindruckender Genauigkeit zu bestimmen. Die Gefahren dahinter rufen auch Datenschützer auf den Plan.
Die Anwendungsgebiete Künstlicher Intelligenz schreiten unbeirrt voran. Ein kürzlich entwickeltes Tool mit dem Namen "PIGEON" (kurz für Prediction Image Geolocations) ruft derzeit allerdings Datenschutzexperten auf den Plan. Laut eines NPR-Berichts kann die von drei Stanford-Absolventen entwickelte KI mithilfe den Standort eines Fotos bestimmen, selbst wenn dieses keine entsprechenden Geotags aufweist.
Anhand dieser Tags wurde PIGEON trainiert: Mithilfe von visuellen Hinweisen wie Wahrzeichen, Gebäuden oder der vorliegenden Vegetation lernte die KI entsprechende Muster, um die Fotos mit "beeindruckender Präzision" den entsprechenden Orten zuweisen zu können. Genutzt wurden hierfür "nur" rund eine halbe Million frei verfügbare Bilder von Google Street View - ein vergleichsweise kleiner Datensatz, der dennoch zu großem Erfolg geführt habe.
Dieser Eindruck äußert sich in einer durchschnittlichen Genauigkeit von rund 82 Prozent. Ein weiterer Test ließ die PIGEON-KI gegen Trevor Rainbolt antreten, einem der bekanntesten und wohl weltbesten Spieler von "Geoguessr". Bei diesem Navigationsspiel werden Nutzer auf einem beliebigen Ort auf der Street-View-Karte platziert und müssen mit möglichst wenigen Schritten herausfinden, wo sie sich befinden. PIGEON konnte Rainbolt in mehreren Runden problemlos schlagen.
Hierin liegt auch nach Ansicht von Datenschutzexperten die Gefahr von PIGEON: Ein solches KI-Tool könne ohne Weiteres dazu genutzt werden, um Bewegungen und Aktivitäten Dritter ohne deren Wissen oder Zustimmung zu verfolgen. Die Anwendungsszenarien reichen hier von Marketing über Stalking bis hin zu staatlicher Überwachung. Entsprechend wird hier ein verstärkter Fokus auf die Entwicklung von Schutzmaßnahmen gefordert, um die Privatsphäre zu schützen. Zudem werden Social-Media-Plattformen und große Tech-Unternehmen aufgefordert, den potenziellen Einsatz von KI transparenter darzustellen.

Ich persönlich finde die Argumente dagegen immer recht amüsant ^^
Wir können sie regulieren, wir können sie verbieten. In Diktaturen wie China, Iran und Russland aber wird KI eine massive Rolle spielen um sich wirtschaftlich (westliche Börsen manipulieren), militärisch (Taktiken oder neue Waffentechniken) und gesundheitlich (Früherkennung, Vermeidung) gewaltig weiter zu entwickeln. Die Möglichkeiten scheinen da gerade zu unendlich zu sein.
Die Frage lautet also: Wollen wir von Despoten regierte Regime die Welt beherrschen lassen oder technisch gleichziehen bzw. vorangehen um das zu verhindern? Das mag jetzt stark vereinfacht zusammengefasst sein, aber unterm Strich läuft es langfristig genau auf das hinaus.
Denn LLMs skalieren nicht oder nur scheiße. Der Sprung der letzten Jahre ist durch die verfügbare Rechenpower passiert, damit wurden einige Probleme totgeworfen ("wir generieren einfach 50 Mal mal und schmeißen die 45 völlig miesen Ergebnisse weg"). Aber das ist nicht linear und selbst ordentlich mehr Rechenpower wird die momentanen Grenzen nicht fixen. Dazu kommt dass die Entscheidungen nicht begründet oder nachvollzogen werden können - für den Einsatz in wichtigen Bereichen ist das aber maßgeblich.
Und final ist Training teuer und unvorhersehbar. Stell dir vor du hast ein LLM für ein Gebiet, das ganz gut läuft, mit 97% Trefferquote (das wäre Weltklasse). Jetzt kommt ein Kunde oder die Öffentlichkeit und macht dich auf einen sehr problematischen Fehler aufmerksam. Was kannst du tun? Du kannst neu trainieren, bis im Modell genau der Fehler nicht mehr auftritt. Problem: das ist ziemlich teuer und du weißt nicht, ob das Modell nicht dafür auf einmal alte Sachen nicht mehr richtig macht oder andere neue Probleme dazukamen. Jetzt könnte man Tests schreiben um das zu verhindern, nur... wenn du die manuell von Experten machen lässt verlierst du jegliche Ersparnis und kannst die Experten eigentlich auch direkt gezielt funktionierende Algorithmen spezifisch für die Aufgabe schreiben lassen.
Also lassen wir doch einfach eine KI die KI testen. Tolle Idee, spart ja Zeit. Leider hat sich rausgestellt, dass das nicht funktioniert und sich eher die oben genannten Probleme dadurch immer weiter verstärken, oder die Leistung der KI immer weiter abnimmt.
Oder man lässt lauter Leute in Billiglohnländern ex post Filter schreiben, die unerwünschte Ergebnisse unterdrücken. Das wird schon gemacht, lässt sich aber systematisch (prompt injection) umgehen oder wird auch einfach durch kreative User massiv gebruteforced. Wenn ich auf ein Filtersystem oder einen Jugendlichen mit Zeit, der Motivation hat setzen soll, setze ich immer auf den Jugendlichen.
So oder so, die Grenzen von LLMs sind ziemlich deutlich. Natürlich wird da noch einiges gefunden werden um die Situation zu verbessern, aber wenn ein Problem NP-vollständig ist, dann ist es eben nicht in vernünftiger Zeit zu lösen, da kommt dann eben auch nicht irgendwann ein magischer Durchbruch durch Forschung.