WorldCanvas：控制模拟世界中的事件

框架 WorldCanvas 超越了被动的生成模型，允许用户主动引导模拟环境中事件的生成方式。🎬 它整合文本指令、空间轨迹和视觉参考，以生成多个代理逻辑且一致互动的视频序列。

用户通过文本指令定义动作，这些指令描述特定的变化。这些指导与预定义轨迹和参考图像相关联，以引导外观。系统处理这些数据，同时动画化多个代理。物体可以根据计划出现或离开场景，框架确保每个元素在每一帧中保留其识别属性，保持叙事连贯性。

控制的关键组件：

WorldCanvas 从被动预测模型前进到交互式模拟器，允许在受控环境中发生意外事件。

这种方法代表了重大演进。与仅预测下一帧不同，WorldCanvas 赋能用户以实时交互模拟。可以插入未计划的事件，同时系统保持虚拟世界的内部逻辑和物理。这使得可以引导复杂的视觉叙事，而不丢失场景的基本连贯性。

交互式模拟器的优势：

WorldCanvas 组织并结构化创建动态模拟世界的过程。通过对事件和代理的精确控制，它将视频生成从单纯预测任务转变为可引导模拟体验。这对于产生长期连贯性和视觉身份至关重要的内容非常有用，将多代理模拟的潜在混乱转化为可管理和创造性的工作流程。🚀