Gemini Omni: Bearbeite Videos per Sprache, wie einen Kaffee ohne Milch bestellen

Google hat Gemini Omni vorgestellt, ein Modell, das es ermöglicht, ein Video in ein anderes umzuwandeln, indem natürliche Sprache in einem Dialogformat verwendet wird. Anders als das vorherige Veo bearbeitet dieses System originale Frames, während die Kohärenz der Szene und die Handlungen der Charaktere erhalten bleiben. Derzeit generiert es Clips von bis zu 10 Sekunden Länge mit Ton, obwohl das Unternehmen bereits plant, diese Grenze zu erweitern.

photorealistic scene of a video editing interface showing two frames side by side, left frame with a person ordering coffee at a counter, right frame with the same person holding an empty cup while speaking, a glowing digital pipeline connecting both frames, subtle waveform lines and audio equalizer bars floating nearby, cinematic lighting with blue and orange tones, sleek modern workspace with a tablet and stylus on a desk, technical illustration style, clean lines, high contrast, demonstrating real-time video transformation through natural language commands, process of editing without visible text or numbers

Physik und historischer Kontext in jedem Bild 🧠

Das Modell stützt sich auf das Gemini-Ökosystem, um Szenen unter Berücksichtigung historischer und wissenschaftlicher Kontexte zu generieren. Es reproduziert Phänomene wie Schwerkraft oder Fluiddynamik präzise, was es beispielsweise ermöglicht, den Hintergrund eines mittelalterlichen Kampfes in einen Weltraumsturm zu ändern, ohne dass die Charaktere wie Luftballons schweben. Es beinhaltet auch die Erstellung personalisierter digitaler Avatare, wobei das umfangreiche Wissen des Systems genutzt wird, um die visuelle Logik beizubehalten.

Der Traum eines jeden YouTubers: Bearbeiten ohne After Effects zu öffnen 🎬

Jetzt kann jeder Sterbliche sagen: Ändere diese Katze in einen tanzenden Dinosaurier und das Video wird gehorchen. Das Schlechte daran ist: Wenn du einen 11-Sekunden-Clip verlangst, wird Gemini dich mit digitaler Verachtung ansehen und dich daran erinnern, dass es sich noch in der Beta-Phase befindet. Aber hey, während du wartest, kannst du einen Avatar erstellen, der Dinge tut, die du niemals tun würdest, wie zum Beispiel das Haus aufräumen. Die menschliche Faulheit hat endlich ihr Werkzeug gefunden.