
Google добавляет функции в Gemini для взаимодействия с изображениями и обнаружения видео с ИИ
Google выпустил значительное обновление для своего приложения Gemini, внедрив инструменты, которые трансформируют способ общения пользователей с моделью Nano Banana. Эти улучшения позволяют более прямое и визуальное взаимодействие, а также включают верификатор для синтетического аудиовизуального контента. 🚀
Визуальное общение с ИИ
Самая заметная функция позволяет пользователям взаимодействовать с изображениями новаторским способом. Вместо того чтобы полагаться только на текстовые описания, теперь вы можете загрузить изображение и рисовать или делать пометки прямо на нём. Это помогает указывать на конкретные области и просить ИИ обработать изменения, проанализировать детали или предоставить контекстную информацию.
Практические случаи использования:- Редактирование фото: Отметить объект для удаления или изменения его цвета.
- Анализ графиков: Обвести секцию диаграммы, чтобы запросить объяснение.
- Планирование дизайнов: Нарисовать эскизы на базовом изображении для итерации идей.
Хотя теперь мы можем рисовать каракули, чтобы ИИ их интерпретировала, настоящий вызов остаётся в том, чтобы она поняла, что этот круг с палочками — это, на самом деле, наш семейный автопортрет.
Проверка происхождения видео
В связи с ростом контента, сгенерированного искусственным интеллектом, Google интегрирует детектор видео с ИИ. Этот инструмент анализирует аудиовизуальный материал для выявления признаков, указывающих на то, что он был произведён или изменён моделями искусственного интеллекта. Его цель — помочь пользователям различать реальные записи и синтетические.
Характеристики детектора:- Анализирует видео на наличие паттернов манипуляции, характерных для контента, сгенерированного ИИ.
- Предоставляет слой верификации в цифровой среде, где такой контент становится всё более распространённым.
- Отвечает на потребность в выявлении синтетического контента и продвижении прозрачности.
Контекст обновления
Эти новинки появляются вскоре после последнего значительного обновления модели Gemini 3 Flash. Интеграция модели Nano Banana и этих инструментов усиливает ставку Google на то, чтобы сделать взаимодействие с ИИ более интуитивным и универсальным, приближая продвинутые возможности обработки изображений и верификации медиа к конечным пользователям. Эволюция продолжается, фокусируясь на понимании не только слов, но и намерений за нашими самыми простыми штрихами. ✍️