引言

在药物发现的过程中,科学家们常常遇到一个令人困惑的现象——「活性悬崖」(Activity Cliffs)。简单来说,就是两个在结构上几乎一模一样的分子,一个表现出惊人的药效,另一个却毫无活性。这种现象让依赖人工智能(AI)进行药物筛选的研究人员头疼不已。为了破解这一难题,北京大学的一个研究团队提出了首个靶标感知的「活性悬崖」通用预测框架——MTPNet(Multi-Grained Target Perception Network)。这一创新性的框架为药物发现提供了新的可能性,相关论文已被IJCAI 2025录用。

背景:活性悬崖的挑战

什么是活性悬崖?

活性悬崖现象指的是在药物分子结构上微小的变化会导致生物活性发生巨大变化。这种变化通常难以预测,因为传统的AI模型在处理这种复杂现象时,往往无法捕捉到分子结构与靶标蛋白之间的细微差别。

传统模型的局限性

在传统的药物发现过程中,AI模型主要依赖于分子的结构特征进行活性预测。然而,这些模型往往忽略了靶标蛋白的特征,导致在面对活性悬崖现象时表现不佳。具体来说,传统模型无法有效地将分子的宏观特征与靶标蛋白的微观特征结合起来,从而无法准确预测分子的生物活性。

MTPNet:创新性的解决方案

多粒度靶标语义感知机制

北大团队提出的MTPNet框架引入了「多粒度靶标语义感知机制」,这一机制将靶标蛋白的宏观特征与结合位点的微观特征相结合,统一建模各类「受体-配体」相互作用网络。具体来说,MTPNet通过以下几个方面实现了对活性悬崖的有效预测:

  1. 多粒度特征提取:MTPNet能够从不同层次提取靶标蛋白和分子的特征,包括全局特征和局部特征,从而捕捉到结构上的细微差别。
  2. 语义感知:通过引入语义感知机制,MTPNet能够更好地理解靶标蛋白和分子之间的相互作用,从而提高预测的准确性。
  3. 统一建模:MTPNet将受体-配体相互作用网络进行统一建模,从而能够全面考虑各种因素对生物活性的影响。

显著的性能提升

在30个活性悬崖数据集上的实验结果表明,MTPNet框架在预测准确性上取得了显著的性能提升。与传统模型相比,MTPNet展现出了理想的泛化能力与可解释性,能够更好地应对活性悬崖现象带来的挑战。

技术细节:MTPNet的实现

数据集与实验设计

为了验证MTPNet的有效性,北大团队使用了30个活性悬崖数据集进行实验。这些数据集涵盖了多种不同的靶标蛋白和分子结构,具有广泛的代表性。实验设计包括以下几个步骤:

  1. 数据预处理:对数据集进行清洗和预处理,确保数据的质量和一致性。
  2. 特征提取:使用多粒度特征提取方法,从分子和靶标蛋白中提取不同层次的特征。
  3. 模型训练:通过大量的实验,调整模型参数,优化预测性能。
  4. 性能评估:使用多种评价指标,包括准确率、召回率、F1分数等,全面评估模型的表现。

实验结果

实验结果表明,MTPNet在多个评价指标上均优于传统模型。特别是在活性悬崖现象的预测上,MTPNet展现出了显著的优势。具体数据如下:

  • 准确率:MTPNet的平均准确率达到了85%,比传统模型提高了15%。
  • 召回率:MTPNet的平均召回率达到了80%,比传统模型提高了10%。
  • F1分数:MTPNet的平均F1分数达到了82%,比传统模型提高了12%。

可解释性与泛化能力

可解释性

MTPNet框架不仅在性能上取得了显著提升,还具有良好的可解释性。通过多粒度特征提取和语义感知机制,MTPNet能够清晰地展示分子结构与靶标蛋白之间的相互作用,从而帮助研究人员更好地理解活性悬崖现象。

泛化能力

MTPNet框架在不同数据集上的表现一致稳定,展现出了理想的泛化能力。这意味着MTPNet不仅能够在特定数据集上取得良好效果,还能够推广到其他不同的数据集和应用场景中


>>> Read more <<<

Views: 0

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注