MotionCanvas：图像秒变视频，港中文联手Adobe突破！

摘要： 香港中文大学、Adobe研究院和莫纳什大学联合推出MotionCanvas，一种创新的图像到视频（I2V）生成方法，它赋予静态图像以生动的动态效果。该技术通过引入运动设计模块，使用户能够直观地在图像上规划相机和物体的运动，从而实现复杂的镜头设计。MotionCanvas有望在电影制作、动画创作、VR/AR体验、游戏开发以及教育培训等领域带来变革。

北京 – 在人工智能驱动的内容创作领域，一项突破性的技术正在重塑我们对静态图像的认知。MotionCanvas，由香港中文大学、Adobe研究院和莫纳什大学的研究人员共同开发，为图像到视频（I2V）生成开辟了新的路径。这项技术不仅能够将静态图像转化为动态视频，更重要的是，它允许用户以直观的方式控制视频中的运动，从而实现前所未有的创作自由。

核心技术与功能：

MotionCanvas的核心在于其独特的运动设计模块。用户可以将输入的图像视为一块“画布”，在这个画布上，他们可以自由地设计相机的运动路径（如平移、旋转、变焦等）以及物体的全局运动（如移动、缩放等）和局部运动（如手臂摆动等）。这种直观的操作方式，极大地降低了视频创作的门槛。

为了确保运动的真实性和连贯性，MotionCanvas还引入了运动信号转换模块。该模块基于深度估计和相机参数估计，能够将用户在3D场景空间中设计的运动意图，准确地转换为2D屏幕空间中的运动信号。这意味着，即使是复杂的运动轨迹和连续的镜头设计，也能在视频中得到流畅自然的呈现。

此外，MotionCanvas还采用了基于预训练的DiT（Diffusion Transformer）模型的运动条件视频生成模型。通过微调，该模型能够根据屏幕空间中的运动条件生成高质量的视频。为了避免直接生成长视频可能导致的运动不连续性问题，MotionCanvas采用了自回归生成的方式，将生成的视频片段作为后续生成的条件，逐步生成连续的视频内容。

应用前景：

MotionCanvas的潜力远不止于简单的视频编辑。它在多个领域都展现出了广阔的应用前景：