Gemini Omni: modifica video parlando, come ordinare un caffè senza latte

Google ha presentato Gemini Omni, un modello che consente di trasformare un video in un altro tramite linguaggio naturale in un formato di dialogo. A differenza del precedente Veo, questo sistema modifica i fotogrammi originali mantenendo la coerenza della scena e le azioni dei personaggi. Attualmente genera clip fino a 10 secondi con audio, anche se l'azienda sta già pianificando di estendere questo limite.

photorealistic scene of a video editing interface showing two frames side by side, left frame with a person ordering coffee at a counter, right frame with the same person holding an empty cup while speaking, a glowing digital pipeline connecting both frames, subtle waveform lines and audio equalizer bars floating nearby, cinematic lighting with blue and orange tones, sleek modern workspace with a tablet and stylus on a desk, technical illustration style, clean lines, high contrast, demonstrating real-time video transformation through natural language commands, process of editing without visible text or numbers

Fisica e contesto storico in ogni fotogramma 🧠

Il modello si basa sull'ecosistema Gemini per generare scene considerando contesti storici e scientifici. Riproduce fenomeni come la gravità o la dinamica dei fluidi con precisione, consentendo, ad esempio, di cambiare lo sfondo di una lotta medievale in una tempesta spaziale senza che i personaggi fluttuino come palloncini. Include anche la creazione di avatar digitali personalizzati, utilizzando la vasta conoscenza del sistema per mantenere la logica visiva.

Il sogno di ogni youtuber: montare senza aprire After Effects 🎬

Ora qualsiasi mortale potrà dire cambia quel gatto con un dinosauro che balla e il video obbedirà. La parte negativa è che se chiedi una clip di 11 secondi, Gemini ti guarderà con disprezzo digitale e ti ricorderà che è ancora in fase beta. Ma ehi, mentre aspetti, puoi creare un avatar che faccia cose che tu non faresti mai, come riordinare la casa. La pigrizia umana, finalmente, ha il suo strumento.