Google добавляет функции в Gemini для взаимодействия с изображениями и обнаружения видео с ИИ

Captura de pantalla de la interfaz de la aplicación Google Gemini mostrando la nueva función de dibujo sobre una imagen subida por el usuario.

Google добавляет функции в Gemini для взаимодействия с изображениями и обнаружения видео с ИИ

Google выпустил значительное обновление для своего приложения Gemini, внедрив инструменты, которые трансформируют способ общения пользователей с моделью Nano Banana. Эти улучшения позволяют более прямое и визуальное взаимодействие, а также включают верификатор для синтетического аудиовизуального контента. 🚀

Визуальное общение с ИИ

Самая заметная функция позволяет пользователям взаимодействовать с изображениями новаторским способом. Вместо того чтобы полагаться только на текстовые описания, теперь вы можете загрузить изображение и рисовать или делать пометки прямо на нём. Это помогает указывать на конкретные области и просить ИИ обработать изменения, проанализировать детали или предоставить контекстную информацию.

Практические случаи использования:

Редактирование фото: Отметить объект для удаления или изменения его цвета.
Анализ графиков: Обвести секцию диаграммы, чтобы запросить объяснение.
Планирование дизайнов: Нарисовать эскизы на базовом изображении для итерации идей.

Хотя теперь мы можем рисовать каракули, чтобы ИИ их интерпретировала, настоящий вызов остаётся в том, чтобы она поняла, что этот круг с палочками — это, на самом деле, наш семейный автопортрет.

Проверка происхождения видео

В связи с ростом контента, сгенерированного искусственным интеллектом, Google интегрирует детектор видео с ИИ. Этот инструмент анализирует аудиовизуальный материал для выявления признаков, указывающих на то, что он был произведён или изменён моделями искусственного интеллекта. Его цель — помочь пользователям различать реальные записи и синтетические.

Характеристики детектора:

Анализирует видео на наличие паттернов манипуляции, характерных для контента, сгенерированного ИИ.
Предоставляет слой верификации в цифровой среде, где такой контент становится всё более распространённым.
Отвечает на потребность в выявлении синтетического контента и продвижении прозрачности.

Контекст обновления

Эти новинки появляются вскоре после последнего значительного обновления модели Gemini 3 Flash. Интеграция модели Nano Banana и этих инструментов усиливает ставку Google на то, чтобы сделать взаимодействие с ИИ более интуитивным и универсальным, приближая продвинутые возможности обработки изображений и верификации медиа к конечным пользователям. Эволюция продолжается, фокусируясь на понимании не только слов, но и намерений за нашими самыми простыми штрихами. ✍️