人工智能赋能分子设计:科学家利用GNN不确定性量化实现高效优化,成果登上《Nature Communications》
[题图:AI生成的分子结构示意图]
撰文:[你的名字/署名]
在浩瀚的化学空间中,高效、精准地设计具有特定功能的分子一直是科研人员孜孜以求的目标。近日,台湾大学的研究团队取得一项突破性进展,他们将图神经网络(GNN)与不确定性量化(UQ)相结合,显著提升了分子设计的效率和可靠性。相关研究成果于2025年4月5日发表在《Nature Communications》上。
分子设计面临的挑战
分子设计是新材料、新药物研发的关键环节。传统的实验方法耗时耗力,而计算辅助分子设计(CAMD)为加速这一过程提供了可能。然而,在广阔的化学空间中进行优化,尤其是在面对与已知数据差异较大的“领域转移”情况时,如何保证预测的准确性,是CAMD面临的一大挑战。
GNN与UQ的巧妙结合
为了解决上述难题,台湾大学的研究人员巧妙地将定向信息传递神经网络(D-MPNN)与遗传算法(GA)相结合,并引入了不确定性量化(UQ)的概念。D-MPNN能够有效地学习分子结构与性质之间的关系,GA则用于在化学空间中搜索最优分子。而UQ的加入,则能够评估模型预测的不确定性,从而避免盲目地信任预测结果。
研究团队系统地评估了UQ增强型D-MPNN在开放化学空间中的优化效果,并探索了最佳的实施策略。他们发现,通过概率改进优化(PIO)进行UQ集成,能够显著提高优化成功率,并支持更可靠地探索化学多样性区域。
实验验证:Tartarus与GuacaMol双平台测试
为了验证该方法的有效性,研究人员使用了Tartarus和GuacaMol这两个著名的分子设计平台进行基准测试。
- Tartarus平台:提供了一系列复杂的基准测试任务,涵盖材料科学、制药和化学反应等领域,能够模拟真实的分子设计挑战。
- GuacaMol平台:是药物发现领域广泛使用的基准平台,包含药物再发现、相似性评估等多种设计任务。
测试结果表明,与传统的不考虑不确定性的方法相比,PIO在大多数情况下都能提高优化成功率。尤其是在多目标任务中,PIO能够更好地平衡相互竞争的目标,展现出显著优势。
PIO方法的优势
PIO方法的关键在于,它利用概率评估来指导优化过程。具体来说,PIO会量化候选分子超过预定义属性阈值的可能性,从而避免选择模型预测不可靠的分子,并促进具有更优异特性的候选分子的筛选。
研究人员指出,在实际应用中,分子性质往往需要满足特定的阈值,而非追求极值。PIO方法恰好能够满足这一需求,为计算辅助分子设计提供了更实用的指导。
未来展望
这项研究为将UQ集成到CAMD中提供了实用指南,有望加速新材料、新药物的研发进程。研究人员也指出,在所需属性与可用数据差异较大的情况下,PIO的性能可能会下降,这提示未来仍需进一步改进该方法。
参考文献
- Uncertainty quantification with graph neural networks for efficient molecular design. Nature Communications, (2025).
关键词:分子设计,图神经网络,不确定性量化,人工智能,新材料,新药研发
[可选:添加研究团队负责人或主要研究人员的采访内容]
[可选:添加相关领域的专家评论]
Views: 2
