北大陈语谦团队提出多模态单细胞数据整合与插补的深度学习方法

北京大学信息工程学院、化学生物学与生物技术学院省部共建肿瘤化学基因组学国家重点实验室、鹏城国家实验室合聘研究员和 AI4S 平台中心主任陈语谦教授团队 在《Nature Communications》上发表了一篇论文,介绍了一种新型的多模态整合方法——Monae,能够实现多模态单细胞数据的整合与插补,为多模态单细胞数据的分析提供了新的工具。

背景:

单细胞数据分析近年来取得了巨大进展,但多模态单细胞数据的整合与插补仍然面临挑战。异构特征空间和技术噪声阻碍了细胞数据的整合,而跨模态获取配对数据的高成本也限制了分析。

Monae 的创新:

陈语谦教授团队开发的 Monae 是一种基于深度学习的框架,能够有效地整合和插补不配对的多模态单细胞数据。Monae 的核心思想是通过联结不同模态之间的关系,并利用对比学习来增强联合空间中的细胞表示。

Monae 的工作原理:

Monae 由自编码器构建,并基于不同模态之间的调控关系构建一个模态联结图。图中的节点对应于特定模态中的单个独立特征。Monae 中的图自编码器学习每个节点的表示,并通过非对称网络生成对比学习中的正样本和负样本。自适应聚类用于增强 Monae 对比学习的细胞表示,增加异质簇之间的判别性。最终,Monae 利用整合的细胞表示来生成插补计数。

Monae 的优势:

  • 整合准确性高: Monae 在多个数据集上表现优于基线方法,在批次去除和生物异质性方面取得了更好的性能。
  • 插补效果显著: Monae 能够有效地进行模态内和跨模态插补,恢复了生物异质性,并能够表征细胞簇之间的差异,促进细胞类型识别等下游任务。
  • 可解释性强: Monae-E 作为 Monae 的变体,支持更快收敛并提供可解释性。

研究意义:

Monae 的出现为多模态单细胞数据的整合与插补提供了新的解决方案,将促进多模态单细胞数据的分析,推动生物医学领域的研究进展。

未来展望:

陈语谦教授团队表示,他们将继续研究 Monae 的应用,并将其扩展到更复杂的多模态单细胞数据分析中,例如时空转录组数据分析。

参考文献:

关键词:

  • 多模态单细胞数据
  • 深度学习
  • 整合
  • 插补
  • Monae
  • 陈语谦
  • 北京大学
  • Nature Communications

总结:

北大陈语谦团队开发的 Monae 方法为多模态单细胞数据的整合与插补提供了新的工具,将促进多模态单细胞数据的分析,推动生物医学领域的研究进展。


>>> Read more <<<

Views: 2

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注