最新消息最新消息

好的,请看我为你撰写的这篇新闻稿。

标题:AI病毒进化预测新突破:北大团队Nature子刊发布通用预测框架,为疫苗研发注入新动力

引言:

在与病毒的持久战中,人类始终面临着一个严峻的挑战:病毒的快速变异。每一次新的突变都可能意味着现有疫苗和药物的失效,甚至引发新一轮的疫情。然而,北京大学信息工程学院的科研团队近日在《Nature Machine Intelligence》上发表的一项研究,为我们带来了新的希望。他们基于达尔文进化论的视角,开发出了一种通用的AI预测框架,能够跨病毒类型、跨毒株地预测病毒进化,为疫苗和药物的快速更新提供了强大的工具,也为我们理解物种复杂的进化机制打开了一扇新的大门。

主体:

一、 进化视角下的病毒变异难题

病毒的进化,本质上是基因适应环境的过程。蛋白质作为功能的载体,决定了病毒的性状,而这些性状在选择压力的作用下不断演变,最终形成了我们今天所看到的病毒多样性。然而,病毒的变异并非随机,它遵循着一定的规律。北京大学田永鸿教授、陈杰副教授指导的博士生聂志伟、硕士生刘旭东团队,正是从进化论的角度出发,重新审视了病毒进化预测的难题。

他们发现,病毒的进化主要面临两大挑战:一是“少数位点突变”,即一个变异株与原始株相比,只有少数位点发生突变,这使得分子内相互作用网络的变化相对微弱,难以被神经网络直接捕获;二是“稀少有益突变”,即在大量的有害突变中,只有极少数突变能够提高病毒的适应性,这造成了数据层面上严重的样本不平衡问题,难以被精准预测。

二、 E2VD框架:微弱突变放大与稀少有益突变挖掘

为了解决上述难题,研究团队提出了一个名为E2VD(Evolution-driven Virus Variation Driver Prediction)的进化驱动的病毒变异驱动力预测框架。该框架的核心在于两个创新设计:“微弱突变放大”和“稀少有益突变挖掘”。

  • 定制化蛋白质语言模型: 研究团队首先定制化了蛋白质语言模型,使其更适合进化预测任务。他们提出了定制化的预训练策略和数据集,在国产AI超算“鹏城云脑II”的256张NPU支持下进行训练,使得模型在参数量较少的情况下,也能实现超越主流模型的预测效果。这为蛋白质语言模型预训练与下游任务之间的权衡提供了新的视角。
  • 突变网络重建模块: E2VD框架还包含一个突变所处相互作用网络的全面重建模块,其中引入了动态粒度注意力机制,以挖掘蛋白质中的motif模式。这有助于放大微弱的突变信号,使得神经网络能够更有效地捕获突变带来的影响。
  • 多任务焦点损失函数: 针对稀少有益突变难以预测的问题,研究团队提出了多任务焦点损失函数。该函数能够显著改善预测表现,将准确率从57.41%提升至91.11%,召回率从15.56%提升至96.30%。在真实世界变异毒株对应的稀少有益突变预测实验中,E2VD将预测精度从13%提升至80%,实现了跨越式的精度提升。

三、 跨病毒类型和毒株的泛化能力

E2VD框架不仅在特定病毒上表现出色,还展现出强大的跨病毒类型和跨毒株的泛化能力。研究团队提出了鲁棒且避免实验批次效应影响的突变所致病毒适应度变化评估指标,并以此评估了模型在新冠病毒、寨卡病毒、流感病毒以及艾滋病病毒上的泛化表现。结果表明,E2VD在不同病毒和毒株之间均表现出理想的泛化能力,始终超越其他方法。

四、 多尺度进化趋势预测

E2VD框架的灵活性还体现在其能够用于灵活定制化组合,以实现不同尺度的进化趋势预测。例如,E2VD可以用于解释大流行内部的病毒进化模式,识别关键的进化驱动力,并预测未来可能出现的变异株。此外,E2VD还可以用于预测不同病毒之间的进化趋势,从而为更广泛的疫苗和药物开发提供指导。

五、 未来展望

这项研究的意义不仅在于提出了一个高效的病毒进化预测框架,更在于它为我们理解病毒的进化机制提供了新的视角。E2VD框架的成功,是科学和AI架构高度融合的典范,它不仅能够加速疫苗和药物的研发,还为我们探索物种复杂的进化机制提供了强大的工具。未来,E2VD有望与疫苗和蛋白类药物设计流程相结合,显著提升设计效率和设计可控度,为人类应对新发病毒感染提供更加坚实的保障。

结论:

北京大学团队的这项研究,无疑是AI在生物医学领域应用的一个重要里程碑。E2VD框架的诞生,不仅为我们预测病毒进化提供了新的工具,也为我们理解生命本身的复杂性提供了新的视角。随着AI技术的不断发展,我们有理由相信,人类在与病毒的斗争中,将拥有更加强大的武器。

参考文献:

(注:由于是模拟新闻稿,部分日期为虚构,请注意区分)


>>> Read more <<<

Views: 5

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注