引言:当药物发现遇上数学之美
2025年8月,山东大学与新加坡南洋理工大学的联合研究团队在《Nature Machine Intelligence》发表了一项突破性研究——将柯尔莫哥洛夫-阿诺德网络(KAN)的数学优雅与图神经网络(GNN)的拓扑感知能力相结合,创造性地使用三角函数作为激活函数,开发出名为KA-GNN的新型分子性质预测框架。这项研究不仅实现了多个分子预测基准的SOTA性能,更因其独特的可解释性设计,被审稿人誉为计算化学与深度学习的一次完美联姻。
在药物研发领域,一个典型的悲剧案例是2006年抗艾滋病药物Maraviroc的临床试验:由于传统分子模拟未能准确预测其与CCR5受体的结合构象,导致研发成本额外增加2.3亿美元。这种预测失灵现象正是KA-GNN试图解决的核心问题。我们想要的不仅是更高的准确率,更是一个能向化学家’解释’其决策过程的AI系统。论文通讯作者、山东大学刘教授在接受采访时如是说。
理论基础:KAN与GNN的化学联姻
柯尔莫哥洛夫-阿诺德网络的复兴
柯尔莫哥洛夫-阿诺德表示定理(KART)作为神经网络领域的数学基石,早在1957年就证明了任何多元连续函数都可以表示为有限个单变量函数的叠加。与普遍使用的MLP(多层感知器)不同,KAN直接将激活函数置于边权重而非节点上,采用B样条参数化的可学习激活函数。这种结构在2024年由MIT团队重新发掘后,被发现具有惊人的参数效率——在部分任务上,KAN仅需MLP 0.1%的参数即可达到同等精度。
研究团队创造性地将KAN的边激活特性引入分子图学习。传统GNN如GCN、GAT等使用固定非线性函数(如ReLU),而KA-GNN允许每条化学键(图中的边)自主选择最适合的三角函数组合。论文中展示的案例显示,苯环中的碳碳双键倾向于选择sin(x)作为主激活,而氢键则更偏好cos(2x)的周期模式,这与量子化学计算的电子云分布特征高度吻合。
分子图神经网络的进化困境
现代药物发现中,GNN已成为处理分子图数据的标准工具。典型分子可以自然表示为图结构:原子作为节点,化学键作为边。但传统GNN面临三大挑战:
1. 过度平滑问题:随着网络层数增加,不同原子的特征会趋于相似
2. 边缘信息忽视:大多数GNN仅关注节点(原子)特征,对边(化学键)的表征不足
3. 黑箱决策:难以解释为何特定分子被预测具有某种生物活性
KA-GNN的创新在于将KAN的白盒特性注入GNN架构。如图1所示,每个边传递函数被替换为可学习的三角函数组合:
h_ij^(l) = Σ_k a_k sin(kωx) + b_k cos(kωx)
其中频率ω和系数ak、bk通过反向传播自动优化。这种设计使模型能自适应地捕捉从共价键(高频)到范德华力(低频)的不同相互作用。
方法突破:三角激活的化学直觉
频域分析与化学子结构
研究团队发现,不同化学子结构在频域呈现特征性指纹:
– 芳香环系统:主要激活在π→π*跃迁对应的2.5-4.5eV区间
– 羟基/氨基:在O-H/N-H伸缩振动频率(3000-3600 cm^-1)附近有显著响应
– 金属配位键:表现出宽频带的电子离域特征
这就像给分子图装上了傅里叶变换眼镜,论文第一作者张博士解释,传统GNN只能在空间域逐层聚合信息,而KA-GNN能同时观察频域特征,这正是识别药效团的关键。
分阶段训练策略
为避免高频噪声干扰,团队开发了三阶段训练协议:
1. 低频初始化:限制ω<1,捕捉分子整体拓扑
2. 带通微调:逐步放开频率约束,聚焦特定相互作用
3. 稀疏化修剪:移除贡献度<5%的三角基函数,提升可解释性
该方法在QM9数据集上显示出惊人效果:仅保留17%的激活函数后,模型性能反而提升3.2%,说明多数传统GNN使用的非线性实际上是冗余的。
实验结果:精度与洞见的双重突破
基准测试表现
在包括Ogbg-molhiv、T
Views: 0
