准确预测蛋白质功能:中山大学基于几何图学习的酶工程新方法
引言
蛋白质是生命的基本组成部分,它们执行着从催化代谢反应到构建细胞结构等各种各样的功能。准确预测蛋白质的功能对于理解生物过程、开发新药以及推动合成生物学等领域至关重要。然而,传统的实验方法来确定蛋白质功能既耗时又昂贵。近年来,人工智能技术,特别是深度学习,为解决这一难题提供了新的思路。
中山大学的研究突破
中山大学的研究团队在《Nature Communications》上发表了题为“Accurately predicting enzyme functions through geometric graph learning on ESMFold-predicted structures”的研究论文,提出了一种基于几何图学习的酶功能预测方法——GraphEC。该方法利用 ESMFold 预测蛋白质结构,并结合预训练的蛋白质语言模型,从蛋白质结构中提取功能信息,从而实现对酶功能的准确预测。
GraphEC的工作原理
GraphEC 的核心思想是将蛋白质结构表示为一个几何图,并利用图神经网络来学习蛋白质结构和功能之间的关系。具体而言,该方法首先使用 ESMFold 预测蛋白质的三维结构,然后将结构信息转化为一个几何图,其中节点代表蛋白质中的氨基酸残基,边代表残基之间的距离和角度。接着,GraphEC 使用预训练的蛋白质语言模型(ProtTrans)来计算每个氨基酸残基的序列嵌入,并将其与几何特征结合起来,作为图神经网络的输入。最后,图神经网络学习从几何图中提取功能信息,并预测酶的 EC 编号、活性位点和最佳 pH 值。
GraphEC 的优势
与传统的酶功能预测方法相比,GraphEC 具有以下优势:
- 准确性更高: GraphEC 在多个独立测试集中均表现出优于现有方法的预测精度。
- 速度更快: GraphEC 可以快速预测酶的功能,这对于大规模的蛋白质功能分析非常有利。
- 可解释性强: GraphEC 可以识别出影响酶功能的关键结构特征,这有助于我们理解酶的功能机制。
GraphEC 的应用前景
GraphEC 的开发为准确预测蛋白质功能开辟了新的道路,它在以下领域具有广泛的应用前景:
- 药物研发: GraphEC 可以帮助识别新的药物靶点,并预测药物与靶点之间的相互作用。
- 合成生物学: GraphEC 可以帮助设计新的酶,用于合成新的化合物或材料。
- 基因组学: GraphEC 可以帮助理解基因组中的功能性蛋白质,并预测基因突变对蛋白质功能的影响。
结论
中山大学的研究团队开发的 GraphEC 方法为准确预测蛋白质功能提供了新的工具,它将推动合成生物学、基因组学等领域的快速发展。未来,随着人工智能技术的不断进步,我们有望开发出更加强大和通用的蛋白质功能预测方法,为解决生命科学中的重大问题做出更大的贡献。
参考文献
- Accurately predicting enzyme functions through geometric graph learning on ESMFold-predicted structures. Nature Communications, 2024.
Views: 0