麻省理工学院(MIT)、斯坦福大学等机构的研究者,在何恺明带领下,推出了一项突破性的研究成果:去噪哈密顿网络(Denoising Hamiltonian Network,DHN)。该网络将哈密顿力学泛化到神经算子,为机器学习在物理推理领域开辟了新的可能性。
在人工智能领域,让机器具备物理推理能力一直是研究人员追求的目标。物理推理,即推断、预测和解释动态系统行为的能力,是科学研究的基石。传统的机器学习方法往往侧重于记忆数据分布,难以真正理解物理定律,解释能量和力的关系。而科学的机器学习则试图通过将物理约束直接嵌入神经网络架构中来解决这一问题。
然而,现有的方法存在两个主要局限:
- 局部性: 主要学习局部时序更新,难以捕捉远程依赖或抽象的系统级交互。
- 前向性: 主要关注前向模拟,忽略了超分辨率、轨迹修复或从稀疏观测中进行参数估计等互补任务。
为了克服这些局限,何恺明团队提出了DHN,旨在构建一个更通用的神经算子,既能遵循物理约束,又能充分发挥神经网络的灵活性和表现力。
DHN的核心创新
DHN通过以下三项关键创新,在利用神经网络灵活性的同时实施物理约束:
- 非局部时间关系建模: DHN 将系统状态组合视为 token,扩展了哈密顿神经算子,从而能够从整体上对系统动态进行推理,而不是分步推理。
- 去噪目标集成: DHN 集成了一个去噪目标,其灵感来自去噪扩散模型,用于减轻数值积分误差。通过迭代地将其预测细化为物理上有效的轨迹,DHN 提高了长期预测的稳定性,同时保持了在不同噪声条件下的适应性。
- 全局条件引入: DHN 引入了全局条件以促进多系统建模。一个共享的全局潜在代码被用来对系统特定属性(例如质量、摆长)进行编码,使 DHN 能够在统一框架下对异构物理系统进行建模,同时保持底层动态的解耦表示。
DHN 的工作原理
DHN 的核心思想是利用哈密顿力学中的概念来构建神经网络。哈密顿力学是一种描述物理系统能量守恒的理论框架。DHN 通过学习系统的哈密顿量,可以预测系统在未来的演化。
为了提高模型的鲁棒性,DHN 引入了去噪机制。该机制通过向输入数据添加噪声,然后训练模型来恢复原始数据,从而使模型对噪声具有更强的抵抗力。
此外,DHN 还采用了掩码建模策略,在训练网络时屏蔽掉部分输入状态。这种策略可确保模型学会迭代改进预测,使其能够从损坏或不完整的观测结果中恢复有物理意义的状态。
实验验证
为了评估 DHN 的通用性,研究者通过三个不同的推理任务对其进行了测试:
- 轨迹预测和完成: 预测系统在未来的轨迹,并补全缺失的轨迹片段。
- 从部分观察中推断物理参数: 根据部分观测数据推断系统的物理参数,例如质量和阻尼系数。
- 通过渐进式超分辨率插入稀疏轨迹: 通过对稀疏轨迹进行超分辨率处理,生成更密集的轨迹。
实验结果表明,DHN 在这些任务上都取得了优异的性能,证明了其在物理推理方面的强大能力。
未来展望
这项工作推动了在局部时序关系之外嵌入物理约束的更通用架构的发展,为更广泛的物理推理应用开辟了道路,超越了传统的前向模拟和下一状态预测。
论文一作 Congyue Deng 表示,DHN 不是最终的解决方案,只是一个开始。她提出了三个开放性问题:
- 如何定义深度学习中的物理推理?
- 什么是物理模拟?
- 神经网络应该具备哪些物理属性?
这些问题将引导未来的研究方向,推动机器学习在物理推理领域取得更大的突破。
参考文献:
- Denoising Hamiltonian Network for Physical Reasoning: https://arxiv.org/pdf/2503.07596
Views: 3