Google: Künstliche Intelligenz erschafft 3D-Szene aus 2D-Bild

5
News Antonio Funes Als bevorzugte Quelle auf Google hinzufügen
Neura-lScene-Rendering vom DeepMind-Team
Quelle: DeepMind-Blog

Im Science-Fiction-Klassiker Blade Runner konnte der Ermittler Deckard (Harrison Ford) anhand von nur einer einzigen Kameraaufnahme das Bild aus mehreren Winkeln betrachten, als stünde ihm eine 3D-Aufnahme zur Verfügung. Ein Deep-Learning-Projekt von Google befasst sich nun erfolgreich mit einer ähnlichen Idee: Ein neuronales Netzwerk lernt anhand von Kameraaufnahmen, aus einem 2D-Bild eine 3D-Szene zu erstellen.

Für das Thema Künstliche Intelligenz wird der Bereich des Deep Learnings immer wichtiger. Dies bedeutet vereinfacht gesagt, dass der Mensch der Software nur eine Basis gibt und sich die Software dann - gegebenenfalls durch zur Verfügung gestellte Datenbanken - selber stetig verbessert und aus vorangegangenen Ergebnissen lernt. Mit einer solchen künstlichen Intelligenz arbeitet unter anderem auch Google. Das Google-Team von DeepMind hat, wie nun engadget berichtet, einer Software entwickelt, die immer besser lernt, wie sie aus 2D-Informationen ein 3D-Bild erstellen kann.

Um genau zu sein, handelt es sich um ein Phänomen, an dem Forscher schon länger arbeiten. Für das menschliche Gehirn reichen beispielsweise stilisierte Konturen von Tieren aus, damit es sofort erkennt, um welches Tier es sich handelt - ein Computer scheitert hier oftmals, außer, es ist zufällig eine sehr ähnliche Kontur in der Datenbank vorhanden. Auch kleine Hinweise bei der Wahrnehmung helfen dem Menschen, Dinge zu erkennen - im weiter unten eingefügten Video wird auch ein passendes Beispiel genannt: Ein Mensch erkennt bereits unterbewusst einen Stuhl unter der Person, da sich die Person in einer sitzenden Stellung befindet. Eine Software tut sich dabei deutlich schwerer. Noch schwieriger ist es für eine Software im Gegensatz zu einem Menschen, sich aus einer einzigen 2D-Aufnahme (im übertragenen Sinne) vorzustellen, wie die Szene in 3D aussehen müsste .

Trotzdem gibt es nun immer bessere Ergebnisse durch Software, auch bei der nötigen Rechenzeit tut sich einiges. Bei der DeepMind-Software des Google-Teams gibt es beim Deep-Learning-Konzept eine Besonderheit, denn sie wird nicht, wie sonst üblich, durch vom Menschen ausgesuchte Datenbanken gefüttert. Vielmehr lernt das neuronale Netzwerk GQN (General Query Network) komplett selbständig, denn es nimmt über Kameras Szenen wahr und versteht im Laufe der Zeit immer besser, aus welchen 2D-Informationen sie Schlüsse für ein 3D-Szenario treffen kann. Das langfristige Ziel ist, dass die Software anhand nur einer einzigen Kameraeinstellung dazu in der Lage ist, eine mögliche 3D-Szene zu erstellen um dann auch ohne größere Rechenzeit Bilder zu erstellen, die aus einer anderen Perspektive stammen, obwohl dort eigentlich gar keine Kamera steht.

Empfohlener redaktioneller Inhalt [EMBED_URL] An dieser Stelle finden Sie externe Inhalte von [PLATTFORM]. Zum Schutz Ihrer persönlichen Daten werden externe Einbindungen erst angezeigt, wenn Sie dies durch Klick auf "Alle externen Inhalte laden" bestätigen: Ich bin damit einverstanden, dass mir externe Inhalte angezeigt werden. Damit werden personenbezogene Daten an Drittplattformen übermittelt. Mehr dazu in unserer Datenschutzerklärung.
Externe Inhalte Mehr dazu in unserer Datenschutzerklärung.
5
    • Kommentare (5)

      Zur Diskussion im Forum
      • Von empy Lötkolbengott/-göttin
        AW: Google: Künstliche Intelligenz erschafft 3D-Szene aus 2D-Bild

        Zitat
        Ein Mensch erkennt bereits unterbewusst einen Stuhl unter der Person, da sich die Person in einer sitzenden Stellung befindet.
        Vorwissen genau dieser Art ist für so eine Umsetzung notwendig. Wir können das auch nur, weil wir wissen, wie groß bestimmte Sachen sind und wie bestimmte Sachen von der anderen Seite vermutlich aussehen. Das ist auch ein großer Angriffspunkt für optische Täuschungen.
      • Von empy Lötkolbengott/-göttin
        AW: Google: Künstliche Intelligenz erschafft 3D-Szene aus 2D-Bild

        Zitat
        Ein Mensch erkennt bereits unterbewusst einen Stuhl unter der Person, da sich die Person in einer sitzenden Stellung befindet.
        Vorwissen genau dieser Art ist für so eine Umsetzung notwendig. Wir können das auch nur, weil wir wissen, wie groß bestimmte Sachen sind und wie bestimmte Sachen von der anderen Seite vermutlich aussehen. Das ist auch ein großer Angriffspunkt für optische Täuschungen.
      • Von Bunny_Joe BIOS-Overclocker(in)
        AW: Google: Künstliche Intelligenz erschafft 3D-Szene aus 2D-Bild

        Zitat von Headcrash
        Leider sieht man gar keine Beispiele. Im Video wird nur rumgequatscht.
        Hier gibts einige Beispiele:
        Google's DeepMind develops AI that can render 3D objects from 2D pictures | VentureBeat
      • Von RyzA Flüssigstickstoff-Guru (m/w)
        AW: Google: Künstliche Intelligenz erschafft 3D-Szene aus 2D-Bild

        Leider sieht man gar keine Beispiele. Im Video wird nur rumgequatscht.
      • Von RRe36 Freizeitschrauber(in)
        AW: Google: Künstliche Intelligenz erschafft 3D-Szene aus 2D-Bild

        @cuteEevee
        [Ins Forum, um diesen Inhalt zu sehen]
      • Von cuteEevee PC-Selbstbauer(in)
        AW: Google: Künstliche Intelligenz erschafft 3D-Szene aus 2D-Bild

        Das erinnert mich an dieses Captcha wo dasteht: "Bitte klicken sie auf jedes Bild in dem Sarrah Conner zu sehen ist" .

        Und nein ich bin da nicht paranoid, ich find es spannend.
      Direkt zum Diskussionsende
  • Print / Abo
    Apps
    PCGH Magazin 07/2026 PC Games 06/2026 play5 07/2026 N-Zone 06/2026 Linux Magazin 06/2026 LinuxUser 06/2026 Raspberry Pi Geek 07/2026
    PC Games Hardware PC Games Linux Magazin Raspberry Pi Geek Computec Kiosk