视频生成器不懂重力,但我们可以教它们

发布于 2026年02月28日 | 从西班牙语翻译
Ilustración conceptual que muestra un cerebro de inteligencia artificial generando un video de una pelota cayendo, con una flecha que indica una trayectoria errónea y lenta, junto a fórmulas físicas de la gravedad tachadas y corregidas.

视频生成器不懂重力,但我们可以教它们

一项创新分析质疑视频生成模型作为真实物理世界模型的能力。该研究聚焦于一条基本定律:重力。初步发现令人信服;这些系统默认生成物体下降的序列,其有效加速度显著低于真实值。尽管考虑了技术因素如尺度或帧率,错误依然存在,表明模型内部理解存在深刻缺陷。🧠⚖️

一个巧妙的协议用于诊断物理故障

为了将问题与单纯视觉伪影隔离,科学家设计了一个无单位协议。他们不是测量绝对值,而是评估两个物体从不同高度坠落的时间比率。这一比例由伽利略原理决定,应是通用的。该测试证明AI模型系统性地违反这一原理,确认其重力动力学表示本质上是错误的,而非简单的参数误解。🔬📉

诊断协议的关键发现:
  • 违反等效原理:模型不尊重经典物理预测的基本时间关系。
  • 固有错误:在修正度量歧义或帧率后,故障依然存在,排除了纯技术起源。
  • 高变异性:错误不一致,表明自然法则的表示不稳定且不鲁棒。
该测试揭示模型违反这一等效原理,确认其重力动力学表示本质上是错误的。

使用定向专业化修正物理

前景并非完全悲观。研究显示,这种物理理解差距可以高效弥补。使用一个低秩轻量适配器(LoRA),专为最小数据集(约一百个球坠落片段)训练,即可实现戏剧性改进。生成的有效加速度从月球值显著接近地球重力。最鼓舞人心的是,这个专家模块将其学到的知识泛化到更复杂场景,而无需额外训练。🛠️🚀

修正方法优势:
  • 数据效率:只需非常小且特定的训练集。
  • 零样本泛化:适配器修正复杂场景(多个物体、倾斜平面),无需在专业训练中见过它们。
  • 保留基础模型:无需对原始生成模型进行昂贵的完整重新训练。

视频生成更连贯的未来

这项工作指明了一条清晰道路:尽管当前的生成模型并非天生理解宇宙定律,我们可以通过选择性指导来教导它们。用最小干预修正具体物理概念的能力,为视觉效果、模拟和创意内容应用开启了更可靠、更连贯的AI系统之门。目前,我们可以确信,通过一个小小的教育推动,AI将不再让一切像低重力环境那样坠落……除非那是期望的效果。🌍✨