昆仑万维发布SkyReels-V2：无限电影生成！

北京 – 在人工智能技术日新月异的今天，国产AI力量再次崭露头角。近日，昆仑万维SkyReels团队正式开源了其研发的SkyReels-V2，一款能够生成无限时长电影的AI模型，为创意内容制作和虚拟仿真领域带来了前所未有的可能性。

SkyReels-V2的发布，无疑打破了传统视频生成模型在时长上的限制，为电影制作、广告创作、短剧拍摄等领域提供了强大的技术支持。这款模型基于创新的扩散强迫（Diffusion-forcing）框架，巧妙地融合了多模态大语言模型（MLLM）、多阶段预训练以及强化学习等前沿技术，实现了高质量、无限时长的视频内容生成。

技术突破：解决行业痛点

长期以来，视频生成领域面临着诸多挑战，例如提示词遵循度不高、视觉质量欠佳、运动动态不够自然以及视频时长难以协调等问题。SkyReels-V2的出现，正是为了解决这些行业痛点。

该模型具备以下几项核心功能：

无限时长视频生成：理论上可以生成无限长的视频，为长篇叙事和复杂场景提供了无限可能。
故事生成：能够根据叙事文本提示，编排出复杂的多动作序列，实现动态叙事，让AI也能“讲故事”。
图像到视频合成：通过微调全序列文本到视频扩散模型（SkyReels-V2-I2V）或结合扩散强迫模型与帧条件（SkyReels-V2-DF），将静态图像转化为连贯的视频，为广告和宣传片制作提供了便捷途径。
摄像导演功能：支持生成流畅且多样化的摄像机运动效果，提升视频的影视感，让AI也能“掌镜”。
元素到视频生成：可以将人物、物体和背景等视觉元素组合成由文本提示引导的连贯视频，特别适合短剧、音乐视频和虚拟电商内容创作。

技术原理：多项创新融合

SkyReels-V2的技术突破并非偶然，而是建立在多项创新技术的基础之上：

多模态大语言模型（MLLM）：利用MLLM生成视频的初始描述，并结合镜头类型、角度、位置、表情和摄像机运动等子专家模型，提供更详细的镜头语言描述，从而提升对提示词的遵循能力。
多阶段预训练：通过渐进式分辨率预训练，从低分辨率（256p）逐步提升到高分辨率（720p），逐步增强模型的生成能力。
强化学习（RL）：利用强化学习优化运动质量，解决现有模型在运动动态性、流畅性和物理合理性方面的不足。
扩散强迫框架（Diffusion Forcing）：为每个帧分配独立的噪声水平，实现视频生成的无限扩展能力，并显著提高生成效率。
高效的数据处理和优化：整合通用数据集、自收集媒体和艺术资源库，并采用FP8量化、多GPU并行和模型蒸馏等技术，显著降低推理时间和计算成本，提高模型的实用性。

开源共享：赋能行业发展

昆仑万维选择开源SkyReels-V2，无疑展现了其推动AI技术发展的决心和开放合作的态度。开发者和研究人员可以通过以下地址获取模型及相关代码：