La inteligencia artificial avanza en el campo del vídeo generativo. Synthesia 2.0 presenta una nueva hornada de avatares digitales capaces de replicar emociones humanas complejas y microgestos naturales. El sistema interpreta un texto y lo transforma en una actuación facial con matices, eliminando la necesidad de actores o sets de grabación. Una herramienta que promete cambiar la producción de contenidos corporativos.
El motor detrás de las expresiones sintéticas 🤖
El salto cualitativo reside en un modelo que analiza el texto y asigna emociones contextuales. No se trata de animaciones predefinidas; el sistema genera en tiempo real movimientos sutiles como el arqueo de cejas, la elevación de comisuras o el parpadeo asincrónico. La red neuronal ha sido entrenada con miles de horas de vídeo humano real para capturar esos detalles que diferencian a un robot de una persona. El resultado: avatares que aprietan los labios al dudar o sonríen con los ojos.
Adiós a fingir interés en reuniones virtuales 😅
La ironía es que, justo cuando los humanos perfeccionamos el arte de poner cara de póker en videollamadas, las máquinas aprenden a fruncir el ceño con convicción. Pronto podrás delegar tu asistencia a una junta aburrida en tu avatar, que asentirá con la sabiduría de un gurú y esbozará una sonrisa comprensiva en el momento exacto. Mientras tú haces otra cosa, tu yo digital sufrirá la reunión por ti. Eso sí, con una expresión facial impecable.