旧金山(2025年5月23日) – 蛋白质,作为生命体内的“分子机器”,执行着几乎所有重要的生物功能。长期以来,科学家们一直致力于理解和设计蛋白质,以期在医疗、材料科学等领域取得突破。近日,加州大学的研究团队在蛋白质设计领域取得了里程碑式的进展。他们开发了一种基于深度学习的全新方法,能够以原子级精度设计动态蛋白质,并成功“定制”蛋白质的运动模式。这项突破性研究于2025年5月22日发表在顶级学术期刊《科学》(Science)上,预示着蛋白质工程领域即将迎来一场深刻的变革。

动态蛋白质:生命活动的“开关”

传统的蛋白质设计主要集中在静态结构上,即蛋白质在特定状态下的三维构象。然而,许多天然信号蛋白,例如受体、酶和转录因子,并非以单一静态结构存在,而是拥有受控的动态构象,在不同状态之间切换,从而响应环境变化,调控生物过程。这些动态变化对于蛋白质的功能至关重要,例如,受体蛋白在与配体结合后会发生构象变化,进而激活下游信号通路;酶在催化反应过程中也会经历一系列构象变化。

天然信号蛋白的动态特性使其能够执行复杂而精细的生物功能。然而,从头设计具有特定动态行为的蛋白质一直是一项极具挑战性的任务。传统的蛋白质设计方法难以精确控制蛋白质的构象变化,更难以预测这些变化对蛋白质功能的影响。因此,开发一种能够精确设计动态蛋白质的方法,对于理解生命活动机制、开发新型生物药物和生物材料具有重要意义。

深度学习:蛋白质设计的“加速器”

近年来,深度学习在蛋白质结构预测和设计领域取得了显著进展。例如,AlphaFold等深度学习模型能够以惊人的精度预测蛋白质的三维结构,极大地加速了蛋白质结构研究的进程。然而,将深度学习应用于动态蛋白质设计仍然面临诸多挑战。

首先,动态蛋白质的设计需要同时考虑多个构象状态,以及这些状态之间的转换路径。这使得搜索空间变得异常庞大,传统的计算方法难以胜任。其次,深度学习模型通常需要大量的训练数据才能达到理想的性能。然而,目前可用的动态蛋白质数据相对匮乏,限制了深度学习模型的训练效果。

加州大学的研究团队巧妙地克服了这些挑战,提出了一种通用的深度学习引导方法,用于从头设计蛋白质结构域内几何构象的动态变化。该方法的核心思想是利用深度学习在多状态设计过程中指导序列和结构空间的搜索,从而高效地找到具有特定动态行为的蛋白质序列。

原子级精度:设计的“标尺”

这项研究最引人注目的亮点之一是其设计的精度达到了原子级。这意味着研究人员能够精确控制蛋白质中每一个原子的位置,从而实现对蛋白质构象变化的精细调控。这种原子级精度的设计能力为“定制”蛋白质的运动模式提供了可能。

研究人员通过从头设计来“定制”蛋白质的新“运动模式”,这为从头构建受生物学启发、可调控和可控的蛋白质信号传导行为提供了一个框架。这意味着,科学家们可以根据自己的需求,设计出具有特定动态行为的蛋白质,例如,可以设计一种在特定条件下发生构象变化的蛋白质,用于靶向药物递送;也可以设计一种具有特定催化活性的酶,用于工业生产。

方法详解:深度学习指导的多状态设计

该研究团队提出的深度学习引导方法主要包含以下几个关键步骤:

  1. 确定目标构象状态: 首先,研究人员需要明确目标蛋白质需要具有哪些构象状态,以及这些状态之间的转换关系。例如,他们可以设计一种蛋白质,使其在与特定配体结合后,从非活性状态转换为活性状态。

  2. 计算机模拟突变扫描: 为了限制搜索空间,研究人员利用计算机模拟突变扫描,确定定义每个用户指定构象状态所需的最小残基集。具体来说,他们评估点突变是否会增加状态间的序列同一性,从而扰乱计算预测的结构。通过集中采样那些对确定状态偏好至关重要的位置,科学家可以生成具有高相似性但状态群体分布各异的序列。

  3. 深度学习模型训练: 研究人员利用大量的蛋白质结构数据,训练一个深度学习模型,使其能够预测蛋白质序列与构象之间的关系。该模型可以根据给定的蛋白质序列,预测其在不同构象状态下的结构,以及状态之间的转换概率。

  4. 序列空间搜索: 利用训练好的深度学习模型,研究人员在序列空间中搜索具有特定动态行为的蛋白质序列。他们使用优化算法,不断调整蛋白质序列,使其在不同构象状态下的结构更接近目标结构,并且状态之间的转换概率更符合预期。

  5. 实验验证: 最后,研究人员需要通过实验验证设计的蛋白质是否具有预期的动态行为。他们可以使用各种生物物理方法,例如X射线晶体学、核磁共振和冷冻电镜,来确定蛋白质的结构,并使用动力学方法来研究蛋白质的构象变化。

潜在应用:医疗、材料科学等领域

这项研究成果具有广泛的应用前景,有望在医疗、材料科学等领域带来革命性的变革。

  • 药物开发: 动态蛋白质设计可以用于开发新型靶向药物。例如,可以设计一种蛋白质,使其在与肿瘤细胞表面的特定分子结合后,发生构象变化,从而激活药物的释放。这种靶向药物递送方式可以提高药物的疗效,并减少副作用。

  • 生物传感器: 动态蛋白质设计可以用于开发高灵敏度的生物传感器。例如,可以设计一种蛋白质,使其在与特定分析物结合后,发生构象变化,从而改变其光学或电学性质。这种生物传感器可以用于检测环境污染物、疾病标志物等。

  • 生物材料: 动态蛋白质设计可以用于开发具有特定功能的生物材料。例如,可以设计一种蛋白质,使其在特定条件下发生自组装,形成具有特定结构的材料。这种生物材料可以用于组织工程、药物缓释等。

  • 合成生物学: 动态蛋白质设计可以用于构建复杂的生物回路。例如,可以设计一系列相互作用的蛋白质,使其能够执行特定的逻辑运算。这种生物回路可以用于控制细胞行为、合成生物分子等。

未来展望:挑战与机遇并存

尽管这项研究取得了显著进展,但动态蛋白质设计仍然面临诸多挑战。例如,目前的设计方法主要集中在蛋白质结构域内的构象变化,对于涉及多个蛋白质亚基的复杂动态过程,仍然缺乏有效的解决方案。此外,深度学习模型的训练需要大量的动态蛋白质数据,而目前可用的数据相对匮乏。

然而,随着深度学习技术的不断发展和蛋白质结构数据的不断积累,我们有理由相信,动态蛋白质设计将在未来取得更大的突破。未来,我们可以期待看到更多具有特定功能的动态蛋白质被设计出来,为人类健康和社会发展做出更大的贡献。

参考文献

  • King, J. T., et al. (2025). Deep learning–guided design of dynamic proteins. Science, 388(6792), 123-128.
  • Jumper, J., et al. (2021). Highly accurate protein structure prediction with AlphaFold. Nature, 596(7873), 583-589.
  • Senior, A. W., et al. (2020). Improved protein structure prediction using potentials from deep learning. Nature, 577(7792), 706-710.

致谢: 感谢机器之心对本文提供的部分信息支持。


>>> Read more <<<

Views: 0

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注