谷歌推出了Gemini Omni Flash,这是一款能够以前所未有的叙事连贯性生成和编辑视频的AI模型。该系统允许修改纹理、运动和场景,同时保持角色连续性和场景物理特性。对于深度伪造审计人员来说,这一进步代表着检测难度质的飞跃,因为传统的视觉不一致性消失了,需要新的取证方法来识别合成内容。
揭露Gemini Omni连贯编辑的取证技术 🕵️
面对像Gemini Omni Flash这样的模型,深度伪造审计必须进化。基于不规则眨眼或唇形同步的经典检测技术在这一代模型面前失效。取证分析现在将集中在三个支柱上:检查压缩元数据,AI编码器会留下异常的统计模式;研究阴影和反射,虽然局部连贯,但可能存在全局光照错误;以及验证粒子物理,如流体或灰尘的行为,这些领域生成模型仍会犯一些时间连续性上的小错误。
迈向合成视频时代的验证标准 🎯
Gemini Omni Flash处理混合输入(图像、音频、文本)的能力迫使验证者采用多层工作流程。提出一个结合使用PhotoGuard等工具进行AI数字指纹分析、检查反射物体物理不一致性以及交叉验证捕获元数据的过程。审计社区必须合作创建参考数据库,以便针对该模型训练特定的检测器,在其使用普及且真实与生成之间的界限几乎不可见之前。
考虑到Gemini Omni Flash在视频生成中保持完美叙事连贯性的能力,取证审计人员如何区分传统的帧操作和尊重原始素材时空连续性的深层语义修改?
(附注:检测深度伪造就像玩寻找沃利游戏,但对象是可疑像素。)