摘要: 一项由哈佛、斯坦福等顶尖学术医疗中心进行的研究表明,OpenAI的o1-preview模型在医疗诊断推理任务中表现卓越,甚至在某些方面超越了人类医生。这项研究引发了关于AI在医疗领域应用的广泛讨论,预示着AI医生时代的到来。

北京 – 人工智能(AI)正在以前所未有的速度渗透到各个领域,医疗行业也不例外。近日,一项由哈佛大学、斯坦福大学等顶尖学术医疗中心联合进行的研究,为AI在医疗诊断领域的应用带来了令人振奋的消息。研究结果显示,OpenAI的o1-preview模型在诊断推理任务中表现出色,甚至在某些情况下超越了人类医生。

这项研究成果发表在预印本网站arXiv上,论文编号为2412.10849。研究团队通过一系列严谨的实验,全面评估了o1-preview模型与数百名医生在医疗诊断方面的表现。

实验结果惊艳:

研究团队首先使用《新英格兰医学杂志》(NEJM)发表的临床病例讨论(CPCs)来评估o1-preview模型。结果显示,两位医生对o1-preview给出的诊断质量评价高度一致,在143个病例中,双方观点相同的比例高达84%。更令人惊讶的是,o1-preview在近八成(78.3%)的病例中,都将正确诊断列入了其“待选清单”中。如果只看它给出的第一个诊断,命中率也高达52%。

此外,研究团队还评估了o1-preview在NEJM CPC病例中选择下一步诊断检查的能力。结果显示,在87.5%的病例中,o1-preview选择了正确的检查方案;另外11%的病例中,方案被两位医生视为“有帮助”。

急诊室表现突出:

为了更贴近真实场景,研究团队还在波士顿一家大型学术三级急诊中心随机抽取患者,采用盲评方式,将o1-preview模型给出的“第二诊疗意见”与专家医生的诊断进行对比。

结果显示,在急诊室初步分诊阶段,o1-preview识别出完全正确或非常接近的诊断的比例为65.8%,高于急诊医生阶段的69.6%和ICU阶段的79.7%。这一数据均超过了两位参与对比的医生(医生1:54.4%、60.8%、75.9%;医生2:48.1%、50.6%、68.4%)。

专家观点:

沃顿商学院教授Ethan Mollick认为,医生应该使用AI来获取诊断的“第二意见”。他表示,医生可以选择是否采纳AI的建议,但不使用AI“越来越像自愿放弃一种能帮助患者的重要工具。”

该论文作者之一,医学博士Liam McCoy也表示,AI尤其适合执行鉴别诊断的任务,这类任务富有创造性,且高度依赖联想。

挑战与展望:

尽管o1-preview模型在医疗诊断领域展现出了巨大的潜力,但仍面临一些挑战。例如,如何确保AI诊断的公平性和避免偏见,以及如何保护患者的隐私等问题。

然而,不可否认的是,AI正在重塑医疗诊断流程。未来,AI医生或将广泛应用于临床实践,为患者提供更精准、更高效的医疗服务。正如沃顿教授Ethan Mollick所言,拒绝AI辅助如同“放弃重要工具”。这场变革的核心,或许不在于谁更优秀,而在于如何让人类医生的经验与AI的精准形成合力。

参考文献:

(完)


>>> Read more <<<

Views: 0

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注