昆仑万维开源SkyReels-A1，表情动作可控！

北京 – 在人工智能视频生成领域，中国科技公司昆仑万维近日开源了其研发的SkyReels-A1算法，这款算法被誉为中国首个SOTA（State-of-the-Art）级别的基于视频基座模型的表情动作可控算法。这一举措无疑将推动AI视频生成技术的发展，并为虚拟形象、远程通信、数字内容创作等领域带来新的可能性。

SkyReels-A1的核心优势在于其对人物表情和动作的精准控制能力。该算法能够基于任意人体比例（包括肖像、半身及全身）生成高度逼真的动态视频，并精确模拟人物表情变化、情绪、皮肤肌理和身体动作等细节，实现高保真微表情还原。与同类产品相比，SkyReels-A1在侧脸表情控制、眉眼微表情生成以及更大幅度的头部和身体动作方面表现更为出色。

技术解析：SkyReels-A1如何实现精准可控？

SkyReels-A1的技术原理主要包括以下几个关键模块：

视频扩散模型： 该模型基于逐步逆转噪声过程，将随机噪声转化为结构化的视频内容。通过Transformer的自注意力机制，捕捉视频中的时空信息，生成连贯且自然的动态内容。
表情感知地标： 算法提取驱动视频中的表情地标（如面部关键点），作为动画生成的运动描述符。借助3D神经渲染模块，精确捕捉细微的表情变化（如眉毛、嘴唇的动作），并将其融入生成过程中。
时空对齐地标引导模块： 该模块使用3D因果编码器将地标信息映射到视频的潜在空间，确保驱动信号与生成视频的时空一致性。通过精细调整，增强运动信号的捕捉能力，确保生成视频的运动连贯性。
面部图像-文本对齐模块： 算法将面部特征映射到文本特征空间，增强身份一致性。通过融合视觉和文本特征，提高生成结果的准确性和身份保留能力。

此外，SkyReels-A1还采用了分阶段训练策略，包括动作驱动训练、身份保持训练和多模块联合微调，以优化模型的泛化能力和生成质量。

应用前景：从虚拟形象到远程通信

SkyReels-A1的应用场景十分广泛，包括：