ReCamMaster：浙大联手快手，视频重渲染新突破

北京讯 – 视频创作领域迎来一项突破性进展。由浙江大学联合快手科技等机构共同研发的视频重渲染框架——ReCamMaster，近日正式亮相。该框架凭借其强大的相机轨迹控制、视频稳定化、超分辨率等功能，为视频创作、后期制作乃至自动驾驶、虚拟现实等领域带来了全新的可能性。

ReCamMaster的核心在于其能够根据用户指定的相机轨迹，重新渲染输入视频，生成具有新视角的动态场景，同时保持与原始视频外观的一致性。这意味着创作者可以摆脱传统拍摄的束缚，通过后期调整相机运动轨迹，为视频添加更具创意的镜头语言，从而增强视觉效果和叙事张力。

技术创新：预训练模型与帧维度条件机制

ReCamMaster的技术原理主要体现在以下几个方面：

预训练的文本到视频扩散模型： ReCamMaster 采用了预训练的文本到视频扩散模型作为基础架构。该模型由一个 3D 变分自编码器（VAE）和一个基于 Transformer 的扩散模型（DiT）组成，能生成高质量的视频内容。
帧维度条件机制： 框架提出了创新的帧维度条件机制，将源视频和目标视频的标记沿帧维度进行拼接，作为扩散 Transformer 的输入。使模型能更好地理解视频对之间的时空关系，生成与源视频保持同步和一致的目标视频。
相机姿态条件： ReCamMaster 通过可学习的相机编码器将目标相机轨迹编码到视频特征中。相机轨迹以旋转和平移矩阵的形式表示，投影到与视频标记相同的通道中，实现对相机轨迹的灵活控制。

此外，为了解决训练数据稀缺的问题，研究团队还构建了一个大规模的多相机同步视频数据集，包含多样化的场景和相机运动，有助于模型泛化到真实世界视频。

应用前景：从视频创作到自动驾驶

ReCamMaster的应用场景十分广泛：

专家观点：开启视频创作的AI新时代

“ReCamMaster的出现，标志着视频创作进入了一个全新的AI时代。”一位不愿透露姓名的业内专家表示，“它不仅降低了视频创作的门槛，也为专业创作者提供了更广阔的创作空间。通过AI技术，我们可以更加自由地控制视频的视角和运动轨迹，从而创造出更具表现力和感染力的作品。”

项目地址：

未来展望：

ReCamMaster的发布，无疑将推动视频创作领域的技术革新。随着AI技术的不断发展，我们有理由相信，未来的视频创作将更加智能化、个性化，为用户带来更加丰富多彩的视觉体验。

参考文献：

Jianhong Bai, et al. ReCamMaster: Recurrent Camera Motion for Video Re-rendering. arXiv preprint arXiv:2503.11647 (2025).
ReCamMaster官方网站: https://jianhongbai.github.io/ReCamMaster/
ReCamMaster Github仓库: https://github.com/KwaiVGI/ReCamMaster