Google añade funciones a Gemini para interactuar con imágenes y detectar vídeos con IA

Captura de pantalla de la interfaz de la aplicación Google Gemini mostrando la nueva función de dibujo sobre una imagen subida por el usuario.

Google añade funciones a Gemini para interactuar con imágenes y detectar vídeos con IA

Google ha lanzado una actualización significativa para su aplicación Gemini, introduciendo herramientas que transforman cómo los usuarios se comunican con el modelo Nano Banana. Estas mejoras permiten una interacción más directa y visual, además de incorporar un verificador para contenido audiovisual sintético. 🚀

Comunicación visual con la IA

La función más destacada permite a los usuarios interactuar con imágenes de una forma novedosa. En lugar de depender solo de descripciones textuales, ahora puedes subir una imagen y dibujar o anotar directamente sobre ella. Esto sirve para señalar áreas específicas y pedir a la IA que procese cambios, analice detalles o proporcione información contextual.

Casos de uso prácticos:

Editar fotos: Marcar un objeto para eliminarlo o cambiar su color.
Analizar gráficos: Rodear una sección de un diagrama para solicitar una explicación.
Planificar diseños: Dibujar bocetos sobre una imagen base para iterar ideas.

Aunque ahora podemos dibujar garabatos para que la IA los interprete, el verdadero desafío sigue siendo que ella entienda que ese círculo con palitos es, en efecto, nuestro autorretrato familiar.

Verificar el origen de los vídeos

Frente al aumento de contenido generado por inteligencia artificial, Google integra un detector de vídeos con IA. Esta herramienta analiza el material audiovisual para identificar señales que indiquen si fue producido o alterado por modelos de inteligencia artificial. Su objetivo es ayudar a los usuarios a discernir entre grabaciones reales y sintéticas.

Características del detector:

Analiza vídeos para buscar patrones de manipulación comunes en contenido generado por IA.
Proporciona una capa de verificación en un entorno digital donde este tipo de contenido es cada vez más frecuente.
Responde a la necesidad de identificar contenido sintético y promover la transparencia.

El contexto de la actualización

Estas novedades llegan poco después de la última actualización importante del modelo Gemini 3 Flash. La integración del modelo Nano Banana y estas herramientas refuerzan la apuesta de Google por hacer que la interacción con la IA sea más intuitiva y versátil, acercando capacidades avanzadas de procesar imágenes y verificar medios a los usuarios finales. La evolución continúa, enfocándose en entender no solo las palabras, sino también las intenciones detrás de nuestros trazos más simples. ✍️

Google añade funciones a Gemini para interactuar con imágenes y detectar vídeos con IA