Googles Gemini integriert interaktive 3D-Visualisierung in seine Antworten

Google hat sein Modell Gemini mit einer bemerkenswerten Fähigkeit aktualisiert: der Generierung von Simulationen und interaktiven 3D-Modellen direkt im Chat. Diese Funktion ermöglicht es den Nutzern, dreidimensionale Darstellungen von Objekten oder Konzepten direkt zu manipulieren. Das Ziel ist es, die interaktive Erfahrung zu bereichern und das Verständnis komplexer Informationen durch eine visuelle und dynamische Erkundung zu erleichtern.

Un usuario manipula un modelo 3D interactivo de una molécula en la interfaz de chat de Gemini.

Technische Grundlagen der Echtzeit-Rendering in einem Chat 🤔

Diese Fähigkeit basiert wahrscheinlich auf der Generierung von Code für Standard-Webumgebungen wie WebGL oder ähnliche Bibliotheken. Gemini könnte einen Code-Snippet erzeugen, der bei Ausführung eine 3D-Szene mit Steuerungen für Rotation, Zoom und Verschiebung initialisiert. Die Komplexität liegt darin, eine textuelle Beschreibung in kohärente geometrische Parameter, Materialien und Lichter zu übersetzen, alles innerhalb der Sicherheitsgrenzen eines Browsers.

Auf Wiedersehen zu Stunden des Modellierens, hallo zu Minuten der Korrekturen 😅

Die 3D-Community könnte das mit einer gewissen Ironie betrachten. Nach Jahren des Perfektionierens von Topologie- und UV-Mapping-Techniken erzeugt nun ein Assistent ein Modell mit ein paar Sätzen. Klar, dann muss man ihm erklären, dass Tische normalerweise keine fünf Beine haben und dass die angeforderte Figur ein internes Skelett für Animationen braucht. Es ist ein toller Shortcut, aber der Teufel steckt, wie immer, in den Details der praktischen Umsetzung.