Google: Künstliche Intelligenz erschafft 3D-Szene aus 2D-Bild

News 06.07.2018 um 09:32 Uhr Antonio Funes Als bevorzugte Quelle auf Google hinzufügen

Quelle: DeepMind-Blog

Im Science-Fiction-Klassiker Blade Runner konnte der Ermittler Deckard (Harrison Ford) anhand von nur einer einzigen Kameraaufnahme das Bild aus mehreren Winkeln betrachten, als stünde ihm eine 3D-Aufnahme zur Verfügung. Ein Deep-Learning-Projekt von Google befasst sich nun erfolgreich mit einer ähnlichen Idee: Ein neuronales Netzwerk lernt anhand von Kameraaufnahmen, aus einem 2D-Bild eine 3D-Szene zu erstellen.

Für das Thema Künstliche Intelligenz wird der Bereich des Deep Learnings immer wichtiger. Dies bedeutet vereinfacht gesagt, dass der Mensch der Software nur eine Basis gibt und sich die Software dann - gegebenenfalls durch zur Verfügung gestellte Datenbanken - selber stetig verbessert und aus vorangegangenen Ergebnissen lernt. Mit einer solchen künstlichen Intelligenz arbeitet unter anderem auch Google. Das Google-Team von DeepMind hat, wie nun engadget berichtet, einer Software entwickelt, die immer besser lernt, wie sie aus 2D-Informationen ein 3D-Bild erstellen kann.

Um genau zu sein, handelt es sich um ein Phänomen, an dem Forscher schon länger arbeiten. Für das menschliche Gehirn reichen beispielsweise stilisierte Konturen von Tieren aus, damit es sofort erkennt, um welches Tier es sich handelt - ein Computer scheitert hier oftmals, außer, es ist zufällig eine sehr ähnliche Kontur in der Datenbank vorhanden. Auch kleine Hinweise bei der Wahrnehmung helfen dem Menschen, Dinge zu erkennen - im weiter unten eingefügten Video wird auch ein passendes Beispiel genannt: Ein Mensch erkennt bereits unterbewusst einen Stuhl unter der Person, da sich die Person in einer sitzenden Stellung befindet. Eine Software tut sich dabei deutlich schwerer. Noch schwieriger ist es für eine Software im Gegensatz zu einem Menschen, sich aus einer einzigen 2D-Aufnahme (im übertragenen Sinne) vorzustellen, wie die Szene in 3D aussehen müsste .

Trotzdem gibt es nun immer bessere Ergebnisse durch Software, auch bei der nötigen Rechenzeit tut sich einiges. Bei der DeepMind-Software des Google-Teams gibt es beim Deep-Learning-Konzept eine Besonderheit, denn sie wird nicht, wie sonst üblich, durch vom Menschen ausgesuchte Datenbanken gefüttert. Vielmehr lernt das neuronale Netzwerk GQN (General Query Network) komplett selbständig, denn es nimmt über Kameras Szenen wahr und versteht im Laufe der Zeit immer besser, aus welchen 2D-Informationen sie Schlüsse für ein 3D-Szenario treffen kann. Das langfristige Ziel ist, dass die Software anhand nur einer einzigen Kameraeinstellung dazu in der Lage ist, eine mögliche 3D-Szene zu erstellen um dann auch ohne größere Rechenzeit Bilder zu erstellen, die aus einer anderen Perspektive stammen, obwohl dort eigentlich gar keine Kamera steht.

Empfohlener redaktioneller Inhalt [EMBED_URL] An dieser Stelle finden Sie externe Inhalte von [PLATTFORM]. Zum Schutz Ihrer persönlichen Daten werden externe Einbindungen erst angezeigt, wenn Sie dies durch Klick auf "Alle externen Inhalte laden" bestätigen: Ich bin damit einverstanden, dass mir externe Inhalte angezeigt werden. Damit werden personenbezogene Daten an Drittplattformen übermittelt. Mehr dazu in unserer Datenschutzerklärung.

Externe Inhalte Mehr dazu in unserer Datenschutzerklärung.

Artikel teilen

Google: Künstliche Intelligenz erschafft 3D-Szene aus 2D-Bild Im Science-Fiction-Klassiker Blade Runner konnte der Ermittler Deckard (Harrison Ford) anhand von nur einer einzigen Kameraaufnahme das Bild aus mehreren Winkeln betrachten, als stünde ihm eine 3D-Aufnahme zur Verfügung. Ein Deep-Learning-Projekt von Google befasst sich nun erfolgreich mit einer ähnlichen Idee: Ein neuronales Netzwerk lernt anhand von Kameraaufnahmen, aus einem 2D-Bild eine 3D-Szene zu erstellen.

Per E-Mail versenden

Artikel teilen

Kommentare (5)