Генераторы видео не понимают гравитацию, но мы можем их научить

Опубликовано 28.01.2026 | Перевод с испанского
Ilustración conceptual que muestra un cerebro de inteligencia artificial generando un video de una pelota cayendo, con una flecha que indica una trayectoria errónea y lenta, junto a fórmulas físicas de la gravedad tachadas y corregidas.

Генераторы видео не понимают гравитацию, но мы можем их научить

Инновационный анализ ставит под сомнение способность генеративных моделей видео выступать в роли истинных моделей физического мира. Исследование сосредоточено на фундаментальном законе: гравитации. Начальные выводы убедительны; эти системы по умолчанию генерируют последовательности, в которых объекты падают с эффективным ускорением, значительно меньшим, чем реальное. Хотя были учтены технические факторы, такие как масштаб или частота кадров, ошибка сохраняется, указывая на глубокий дефицит во внутреннем понимании модели. 🧠⚖️

Изысканный протокол для диагностики физической ошибки

Чтобы изолировать проблему от простых визуальных артефактов, ученые разработали протокол без единиц измерения. Вместо измерения абсолютных значений они оценили отношение времени падения двух объектов с разных высот. Эта пропорция, диктуемая принципом Галилея, должна быть универсальной. Тест показал, что модели ИИ систематически нарушают этот принцип, подтверждая, что их представление о гравитационной динамике внутренне неверно и не является простым недоразумением параметров. 🔬📉

Ключевые выводы протокола диагностики:
  • Нарушение принципа эквивалентности: Модели не уважают фундаментальные временные отношения, предсказанные классической физикой.
  • Врожденная ошибка: Неисправность сохраняется после исправления метрических неоднозначностей или частоты кадров, исключая чисто техническое происхождение.
  • Высокая изменчивость: Ошибки не последовательны, что предполагает нестабильное и малоустойчивое представление естественных законов.
Тест показывает, что модели нарушают этот принцип эквивалентности, подтверждая, что их представление о гравитационной динамике внутренне неверно.

Исправление физики с помощью направленной специализации

Перспектива не полностью пессимистична. Исследование показывает, что этот пробел в физическом понимании можно эффективно устранить. Используя легкий адаптер низкого ранга (LoRA), специализированный и обученный на минимальном наборе данных (около сотни клипов падающего мяча), достигается драматическое улучшение. Эффективное ускорение, генерируемое моделью, переходит от лунных значений к заметному приближению к земной гравитации. Самое ободряющее то, что этот специализированный модуль обобщает свои приобретенные знания на более сложные сценарии без дополнительного обучения. 🛠️🚀

Преимущества метода коррекции:
  • Эффективность данных: Требуются очень маленькие и специфические наборы для обучения.
  • Zero-shot обобщение: Адаптер исправляет сложные сценарии (множество объектов, наклонные плоскости) без их просмотра во время специализированного обучения.
  • Сохранение базовой модели: Не требуется дорогостоящее полное переобучение оригинальной генеративной модели.

Более coherentное будущее для генерации видео

Эта работа прокладывает четкий путь: хотя современные генеративные модели не рождаются с врожденным пониманием законов вселенной, мы можем обучать их избирательно. Способность исправлять конкретные физические концепции минимальными вмешательствами открывает дверь к более надежным и coherentным системам ИИ для приложений в визуальных эффектах, симуляции и креативном контенте. Пока что мы можем быть уверены, что с небольшим образовательным толчком ИИ больше не будет заставлять все падать как в среде низкой гравитации... разве что это желаемый эффект. 🌍✨