
Google ajoute des fonctions à Gemini pour interagir avec des images et détecter des vidéos avec IA
Google a lancé une mise à jour significative pour son application Gemini, introduisant des outils qui transforment la façon dont les utilisateurs communiquent avec le modèle Nano Banana. Ces améliorations permettent une interaction plus directe et visuelle, en plus d'intégrer un vérificateur pour le contenu audiovisuel synthétique. 🚀
Communication visuelle avec l'IA
La fonction la plus remarquable permet aux utilisateurs d'interagir avec des images de manière novatrice. Au lieu de dépendre uniquement de descriptions textuelles, vous pouvez maintenant télécharger une image et dessiner ou annoter directement dessus. Cela sert à indiquer des zones spécifiques et à demander à l'IA de traiter des changements, d'analyser des détails ou de fournir des informations contextuelles.
Cas d'utilisation pratiques :- Modifier des photos : Marquer un objet pour le supprimer ou changer sa couleur.
- Analyser des graphiques : Entourer une section d'un diagramme pour demander une explication.
- Planifier des designs : Dessiner des esquisses sur une image de base pour itérer des idées.
Bien que nous puissions maintenant dessiner des gribouillis pour que l'IA les interprète, le vrai défi reste qu'elle comprenne que ce cercle avec des bâtonnets est, en effet, notre autoportrait familial.
Vérifier l'origine des vidéos
Face à l'augmentation du contenu généré par intelligence artificielle, Google intègre un détecteur de vidéos avec IA. Cet outil analyse le matériel audiovisuel pour identifier des signaux indiquant s'il a été produit ou modifié par des modèles d'intelligence artificielle. Son objectif est d'aider les utilisateurs à discerner entre des enregistrements réels et synthétiques.
Caractéristiques du détecteur :- Analyse des vidéos pour rechercher des modèles de manipulation courants dans le contenu généré par IA.
- Fournit une couche de vérification dans un environnement numérique où ce type de contenu est de plus en plus fréquent.
- Répond au besoin d'identifier le contenu synthétique et de promouvoir la transparence.
Le contexte de la mise à jour
Ces nouveautés arrivent peu après la dernière mise à jour importante du modèle Gemini 3 Flash. L'intégration du modèle Nano Banana et ces outils renforcent l'engagement de Google à rendre l'interaction avec l'IA plus intuitive et polyvalente, en rapprochant des capacités avancées de traitement d'images et de vérification de médias des utilisateurs finaux. L'évolution continue, en se concentrant sur la compréhension non seulement des mots, mais aussi des intentions derrière nos traits les plus simples. ✍️