Google adiciona funções ao Gemini para interagir com imagens e detectar vídeos com IA

Captura de pantalla de la interfaz de la aplicación Google Gemini mostrando la nueva función de dibujo sobre una imagen subida por el usuario.

Google adiciona funções ao Gemini para interagir com imagens e detectar vídeos com IA

Google lançou uma atualização significativa para seu aplicativo Gemini, introduzindo ferramentas que transformam como os usuários se comunicam com o modelo Nano Banana. Essas melhorias permitem uma interação mais direta e visual, além de incorporar um verificador para conteúdo audiovisual sintético. 🚀

Comunicação visual com a IA

A função mais destacada permite que os usuários interajam com imagens de uma forma inovadora. Em vez de depender apenas de descrições textuais, agora você pode enviar uma imagem e desenhar ou anotar diretamente sobre ela. Isso serve para indicar áreas específicas e pedir à IA que processe mudanças, analise detalhes ou forneça informações contextuais.

Casos de uso práticos:

Editar fotos: Marcar um objeto para removê-lo ou mudar sua cor.
Analisar gráficos: Cercar uma seção de um diagrama para solicitar uma explicação.
Planejar designs: Desenhar esboços sobre uma imagem base para iterar ideias.

Embora agora possamos desenhar rabiscos para que a IA os interprete, o verdadeiro desafio continua sendo que ela entenda que aquele círculo com palitinhos é, de fato, nosso autorretrato familiar.

Verificar a origem dos vídeos

Diante do aumento de conteúdo gerado por inteligência artificial, Google integra um detector de vídeos com IA. Essa ferramenta analisa o material audiovisual para identificar sinais que indiquem se foi produzido ou alterado por modelos de inteligência artificial. Seu objetivo é ajudar os usuários a discernir entre gravações reais e sintéticas.

Características do detector:

Analisa vídeos para buscar padrões de manipulação comuns em conteúdo gerado por IA.
Fornece uma camada de verificação em um ambiente digital onde esse tipo de conteúdo é cada vez mais frequente.
Responde à necessidade de identificar conteúdo sintético e promover a transparência.

O contexto da atualização

Essas novidades chegam pouco depois da última atualização importante do modelo Gemini 3 Flash. A integração do modelo Nano Banana e essas ferramentas reforçam a aposta do Google em tornar a interação com a IA mais intuitiva e versátil, aproximando capacidades avançadas de processar imagens e verificar mídias dos usuários finais. A evolução continua, focando em entender não apenas as palavras, mas também as intenções por trás de nossos traços mais simples. ✍️