香港,2025年2月11日 – 理解蛋白质等生物大分子的动力学行为,对于解析其功能机制和开发分子疗法至关重要。然而,生物过程往往涉及复杂的高维动力学以及原子间相互作用,这对现有的计算处理技术提出了巨大挑战。近日,香港城市大学李皓亮研究团队提出了一种名为Deep Signature的深度学习框架,旨在高效表征生物大分子复杂运动,为相关领域研究带来突破。该研究成果已被国际顶级人工智能会议ICLR 2025接收。
研究背景:分子动力学模拟的挑战与机遇
生物过程在分子层面上主要受大分子(特别是蛋白质和酶)构象动态变化的驱动。这些构象变化决定了诸如蛋白-配体结合、分子运输和酶促反应等关键生物事件。因此,深入解析这些分子动力学行为对于理解分子功能和药物设计至关重要。
分子动力学 (MD) 模拟基于密度泛函理论,能够高精度地生成每个原子在三维构象空间中的轨迹,是目前研究分子动态机制的重要计算工具。尽管 MD 模拟技术取得了显著进展,但对其高维轨迹数据的分析仍然面临重大挑战。
这一挑战主要源于大规模分子体系中复杂的原子间相互作用,以及跨越不同时间尺度的动态行为。目前,许多研究采用简化的生物物理模型来分析特定的动力学特征,如波动、弛豫时间、稳定性和状态转换等。然而,随着高性能计算,尤其是 GPU 加速深度学习的发展,研究人员开始尝试使用数据驱动的方法自动学习 MD 轨迹的分子表示。
Deep Signature:结合生物结构信息与粗粒化映射的创新框架
为了解决上述挑战,李皓亮团队提出了Deep Signature,一个计算高效的框架,它结合生物结构信息与粗粒化映射(Coarse Graining),用于自动分析蛋白质轨迹动力学。该框架主要由两个模块构成:
-
深度谱聚类模块(Deep spectral clustering module): 该模块基于软谱聚类(Soft Spectral Clustering)来聚合原子的协同动态,其中聚类分配函数由图神经网络自动学习,从而避免了手动选择粗粒化映射的需求。
-
路径签名变换模块 (Path signature transform module): 路径签名(Path Signature)是一个数学上严格定义的概念,它通过迭代积分来紧凑而丰富地描述粗糙路径的几何信息,特别适用于高采样、非平滑的分子轨迹分析。
Deep Signature 的特征提取方法在理论上保证了以下关键几何对称性:平移不变性、近似旋转不变性、原子坐标排列等变性以及时间重参数化不变性,确保了其对 MD 轨迹的随机波动具有鲁棒性。
实验验证:Deep Signature 在多项基准任务中表现出色
为了验证 Deep Signature 的有效性,研究团队在以下三项基准任务上进行了实验:
- 基因调控动力学(Gene Regulatory Dynamics): Deep Signature 在所有评测指标上均优于基线方法,并在模拟时间增加和系统规模扩大的场景中表现出稳定性。
- 表皮生长因子受体(EGFR)突变动力学
- G 蛋白偶联受体(GPCR)动力学
此外,研究人员还使用 t-SNE 对 EGFR 的训练集和测试集数据进行可视化分析,结果表明,相较于基线方法,Deep Signature 提取的特征分布更均匀,使得不同类别的样本更易区分,展现了良好的泛化能力。
未来展望:Deep Signature 有望加速药物发现和分子疗法开发
Deep Signature 的成功研发,为生物大分子运动表征学习提供了一种高效且精确的新方法。该框架不仅能够处理大规模 MD 数据,还能充分利用生物结构信息,并具备良好的几何对称性和泛化能力。
这项研究成果有望加速药物发现和分子疗法开发,为相关领域的研究人员提供更强大的工具,从而更深入地理解生命过程的本质。
论文信息:
- 论文题目: Deep Signature: Characterization of Large-Scale Molecular Dynamics
- 论文地址: https://openreview.net/pdf?id=xayT1nn8Mg
- 开源代码: https://github.com/WonderSeven/Deep-Signature
关于香港城市大学李皓亮研究团队:
李皓亮研究团队致力于开发先进的计算方法和人工智能技术,用于解决生物医学领域的重要问题。该团队的研究方向包括蛋白质结构预测、分子动力学模拟、药物设计和生物信息学等。
联系方式:
[请联系香港城市大学宣传部门获取更多信息]
关键词: Deep Signature, 分子动力学, 蛋白质, 深度学习, ICLR 2025, 香港城市大学, 李皓亮, 药物研发, 分子疗法
Views: 0
