Google hat Gemini Omni vorgestellt, ein Modell, das es ermöglicht, ein Video in ein anderes umzuwandeln, indem natürliche Sprache in einem Dialogformat verwendet wird. Anders als das vorherige Veo bearbeitet dieses System originale Frames, während die Kohärenz der Szene und die Handlungen der Charaktere erhalten bleiben. Derzeit generiert es Clips von bis zu 10 Sekunden Länge mit Ton, obwohl das Unternehmen bereits plant, diese Grenze zu erweitern.
Physik und historischer Kontext in jedem Bild 🧠
Das Modell stützt sich auf das Gemini-Ökosystem, um Szenen unter Berücksichtigung historischer und wissenschaftlicher Kontexte zu generieren. Es reproduziert Phänomene wie Schwerkraft oder Fluiddynamik präzise, was es beispielsweise ermöglicht, den Hintergrund eines mittelalterlichen Kampfes in einen Weltraumsturm zu ändern, ohne dass die Charaktere wie Luftballons schweben. Es beinhaltet auch die Erstellung personalisierter digitaler Avatare, wobei das umfangreiche Wissen des Systems genutzt wird, um die visuelle Logik beizubehalten.
Der Traum eines jeden YouTubers: Bearbeiten ohne After Effects zu öffnen 🎬
Jetzt kann jeder Sterbliche sagen: Ändere diese Katze in einen tanzenden Dinosaurier und das Video wird gehorchen. Das Schlechte daran ist: Wenn du einen 11-Sekunden-Clip verlangst, wird Gemini dich mit digitaler Verachtung ansehen und dich daran erinnern, dass es sich noch in der Beta-Phase befindet. Aber hey, während du wartest, kannst du einen Avatar erstellen, der Dinge tut, die du niemals tun würdest, wie zum Beispiel das Haus aufräumen. Die menschliche Faulheit hat endlich ihr Werkzeug gefunden.