
Google 为 Gemini 添加功能,用于与图像交互并检测 AI 视频
Google 已为其应用 Gemini 发布了重大更新,引入了改变用户与模型 Nano Banana 沟通方式的工具。这些改进允许更直接和视觉化的交互,同时加入了合成视听内容的验证器。🚀
与 AI 的视觉沟通
最突出的功能允许用户以一种新颖的方式与图像交互。不再仅依赖文本描述,现在你可以上传一张图像并直接在其上绘制或标注。这有助于指明特定区域,并要求 AI 处理更改、分析细节或提供上下文信息。
实用用例:- 编辑照片: 标记一个物体以删除它或更改其颜色。
- 分析图表: 环绕图表的一个部分以请求解释。
- 规划设计: 在基础图像上绘制草图以迭代想法。
虽然现在我们可以绘制涂鸦让 AI 解释,但真正的挑战仍然是让它理解那个带棍子的圆圈确实是我们家庭的自画像。
验证视频来源
面对人工智能生成内容激增,Google 集成了AI 视频检测器。此工具分析视听材料以识别表明其由人工智能模型生成或更改的信号。其目标是帮助用户辨别真实录像和合成内容。
检测器的特性:- 分析视频以寻找 AI 生成内容中常见的操纵模式。
- 在这种内容日益频繁的数字环境中提供验证层。
- 响应识别合成内容并促进透明度的需求。
更新背景
这些新功能在 Gemini 3 Flash 模型的最后一次重大更新后不久推出。Nano Banana 模型和这些工具的集成强化了 Google 使 AI 交互更直观和多功能的承诺,将处理图像和验证媒体的高级功能带给最终用户。演进仍在继续,专注于不仅理解话语,还理解我们最简单笔触背后的意图。✍️