周四. 5 月 14th, 2026

京东港大联手，AI“声”动3D人脸！

作者智能小编

2 月 8, 2025 #3D, #每日AI快讯, #音频

北京 – 在人工智能技术日新月异的今天，视频编辑领域迎来了一项突破性进展。近日，京东科技与香港大学联合推出了一款名为JoyGen的音频驱动3D说话人脸视频生成框架。该框架专注于实现精确的唇部与音频同步以及高质量的视觉效果，为虚拟主播、动画制作、在线教育以及多语言视频生成等领域带来了全新的可能性。

JoyGen的核心在于其能够结合音频特征和面部深度图，驱动唇部运动的生成，并采用单步UNet架构进行高效的视频编辑。这意味着，用户可以基于现有的视频素材，通过输入音频，快速生成与音频内容精准对应的唇部动作，而无需重新生成整个视频。

技术解析：JoyGen如何实现精准的唇部同步与高质量视觉效果？

JoyGen的技术原理主要分为两个阶段：

第一阶段：音频驱动的唇部运动生成
- 3D重建模型： 从输入的面部图像中提取身份系数，用于描述人物的面部特征。
- 音频到运动模型： 基于音频到运动模型将音频信号转换为表情系数，用于控制唇部的运动。
- 深度图生成： 结合身份系数和表情系数生成面部的3D网格，并基于可微渲染技术生成面部深度图，用于后续的视频合成。
第二阶段：视觉外观合成
- 单步UNet架构： 采用单步UNet网络将音频特征和深度图信息整合到视频帧的生成过程中。UNet基于编码器将输入图像映射到低维潜在空间，结合音频特征和深度图信息进行唇部运动的生成。
- 跨注意力机制： 音频特征基于跨注意力机制与图像特征交互，确保生成的唇部运动与音频信号高度一致。
- 解码与优化： 生成的潜在表示基于解码器还原为图像空间，生成最终的视频帧。基于L1损失函数在潜在空间和像素空间进行优化，确保生成视频的高质量和同步性。

为了确保模型的性能，JoyGen在训练过程中使用了包含130小时中文视频的高质量数据集，并在开源的HDTF数据集上进行了验证。实验结果表明，JoyGen在唇部与音频同步和视觉质量方面均达到了行业领先水平。

应用前景：JoyGen将如何改变视频内容创作？

JoyGen的应用场景广泛，包括：

虚拟主播与直播： 创建虚拟主播，实现新闻播报、电商直播等，根据输入音频实时生成逼真唇部运动，提升观众体验。
动画制作： 在动画影视领域，快速生成与配音同步的唇部动画，减少动画师工作量，提高制作效率。
在线教育： 生成虚拟教师形象，实现与教学语音同步的唇部动作，让教学视频更生动，增强学生学习兴趣。
视频内容创作： 帮助创作者快速生成高质量说话人脸视频，如虚拟人物短剧、搞笑视频等，丰富创作形式。
多语言视频生成： 支持多语言，将一种语言的视频快速转换为其他语言版本，且唇部动作与新语言音频同步，便于内容国际化传播。

JoyGen的推出，无疑为视频内容创作领域注入了新的活力。它不仅降低了视频编辑的门槛，提高了制作效率，还为创作者提供了更多的创作可能性。

未来展望：AI驱动的视频编辑将走向何方？

随着人工智能技术的不断发展，AI驱动的视频编辑将迎来更加广阔的发展前景。未来，我们可以期待更加智能、高效、便捷的视频编辑工具的出现，它们将能够更好地满足用户多样化的需求，推动视频内容创作的繁荣发展。

相关链接：

项目官网：https://joy-mm.github.io/JoyGen/
GitHub仓库：https://github.com/JOY-MM/JoyGen
arXiv技术论文：https://arxiv.org/pdf/2501.01798

结语：

JoyGen的发布，是京东科技与香港大学在人工智能领域的一次成功合作。它不仅展示了AI技术在视频编辑领域的巨大潜力，也为未来的技术发展指明了方向。我们有理由相信，在AI的驱动下，视频内容创作将迎来更加美好的未来。

>>> Read more <<<

Views: 1

相关文章

AI生成 NEWS 公司估值智能新闻

永新光学 (603297.SH) ：国产替代与新兴业务驱动下的价值重估

2 月 7, 2026 既智

AI生成 NEWS 智能新闻

来伊份：转型阵痛中的价值重塑与未来突围

12 月 26, 2025 既智

AI生成 NEWS 智能新闻

北方稀土 (600111.SH): 战略核心资产的价值重估——迎接“戴维斯双击”

12 月 26, 2025 既智

发表回复取消回复

图库

90年代申花出租车司机夜晚在车内看文汇报

黄山的油菜花

90年代的黄河路

shanghai

上海的陆家嘴

上海的陆家嘴

在上海浦东滨江公园观赏外滩建筑群-20240824

上海枫泾古镇一角_20240824

上海宝山炮台湿地公园的蓝天白云

为您推荐

AI生成 NEWS 公司估值智能新闻

永新光学 (603297.SH) ：国产替代与新兴业务驱动下的价值重估

2026年2月7日

AI生成 NEWS 智能新闻

来伊份：转型阵痛中的价值重塑与未来突围

2025年12月26日

AI生成 NEWS 智能新闻

北方稀土 (600111.SH): 战略核心资产的价值重估——迎接“戴维斯双击”

2025年12月26日

AI生成 NEWS 公司估值

国之重器，芯之所向：新周期与大国博弈下的中芯国际(688981.SH)价值重估

2025年12月26日