重磅！港中大、字节、清华联手发布Hi3DGen框架

摘要： 香港中文大学（深圳）、字节跳动和清华大学的研究人员联合推出了一款名为Hi3DGen的创新3D几何生成框架。该框架能够从2D图像生成高保真3D模型，在几何细节的生成方面显著优于现有方法，为游戏开发、影视制作、文物保护等领域带来革新。

北京 – 在人工智能领域，3D模型生成一直是备受关注的研究方向。近日，由香港中文大学（深圳）、字节跳动和清华大学的研究人员共同研发的Hi3DGen框架，为这一领域带来了新的突破。该框架能够从2D图像生成高保真3D模型，其生成的几何细节丰富程度远超现有技术，有望在多个行业引发变革。

Hi3DGen的核心在于其能够将2D图像转化为具有丰富细节的3D几何模型。为了实现这一目标，该框架采用了三个关键组件：

图像到法线估计器： 该组件通过噪声注入和双流训练，将图像的低频和高频模式解耦。低频模式负责整体形状和结构，高频模式负责细节和纹理。这种方法能够生成可泛化、稳定且锐利的法线图，为后续的3D几何生成提供高质量的中间表示。
法线到几何学习方法： 该方法基于法线图作为正则化手段，对潜在扩散模型进行训练。这增强了3D几何生成的保真度，使生成的3D模型能保留更多的细节。
3D数据合成管道： 通过构建高质量的3D数据集，用于训练模型，支持模型学习从2D图像到3D几何的映射关系。

Hi3DGen还采用了两阶段生成过程：

此外，Hi3DGen还利用3D高斯散射（3DGS）从生成的高分辨率多视角图像中学习隐式3D模型，并通过基于SDF（Signed Distance Function）的重建方法，从增强的密集视图中提取高质量的3D网格。

Hi3DGen的技术突破，使其在多个领域具有广阔的应用前景：

Hi3DGen项目已开源，研究人员可以在GitHub上获取相关代码和资料，进行进一步的研究和应用开发。

Hi3DGen的发布，标志着3D模型生成技术迈上了一个新的台阶。随着技术的不断发展和完善，相信Hi3DGen将在更多领域发挥重要作用，为人们的生活和工作带来更多便利和创新。

参考文献：

Stable-X. (n.d.). Hi3DGen: High-Fidelity 3D Geometry Generation from 2D Images. Retrieved from https://stable-x.github.io/Hi3DGen/
Stable-X. (n.d.). Hi3DGen GitHub Repository. Retrieved from https://github.com/Stable-X/Hi3DGen

（完）

>>> Read more <<<