Hinton梦想成真？AI医生斯坦福哈佛实测超人类

摘要： 一项由哈佛、斯坦福等顶尖学术医疗中心进行的研究表明，OpenAI的o1-preview模型在医疗诊断推理任务中表现卓越，甚至在某些方面超越了人类医生。这项研究引发了关于AI在医疗领域应用的广泛讨论，预示着AI医生时代的到来。

北京 – 人工智能（AI）正在以前所未有的速度渗透到各个领域，医疗行业也不例外。近日，一项由哈佛大学、斯坦福大学等顶尖学术医疗中心联合进行的研究，为AI在医疗诊断领域的应用带来了令人振奋的消息。研究结果显示，OpenAI的o1-preview模型在诊断推理任务中表现出色，甚至在某些情况下超越了人类医生。

这项研究成果发表在预印本网站arXiv上，论文编号为2412.10849。研究团队通过一系列严谨的实验，全面评估了o1-preview模型与数百名医生在医疗诊断方面的表现。

实验结果惊艳：

研究团队首先使用《新英格兰医学杂志》（NEJM）发表的临床病例讨论（CPCs）来评估o1-preview模型。结果显示，两位医生对o1-preview给出的诊断质量评价高度一致，在143个病例中，双方观点相同的比例高达84%。更令人惊讶的是，o1-preview在近八成（78.3%）的病例中，都将正确诊断列入了其“待选清单”中。如果只看它给出的第一个诊断，命中率也高达52%。

此外，研究团队还评估了o1-preview在NEJM CPC病例中选择下一步诊断检查的能力。结果显示，在87.5%的病例中，o1-preview选择了正确的检查方案；另外11%的病例中，方案被两位医生视为“有帮助”。

急诊室表现突出：

为了更贴近真实场景，研究团队还在波士顿一家大型学术三级急诊中心随机抽取患者，采用盲评方式，将o1-preview模型给出的“第二诊疗意见”与专家医生的诊断进行对比。

结果显示，在急诊室初步分诊阶段，o1-preview识别出完全正确或非常接近的诊断的比例为65.8%，高于急诊医生阶段的69.6%和ICU阶段的79.7%。这一数据均超过了两位参与对比的医生（医生1：54.4%、60.8%、75.9%；医生2：48.1%、50.6%、68.4%）。

专家观点：

沃顿商学院教授Ethan Mollick认为，医生应该使用AI来获取诊断的“第二意见”。他表示，医生可以选择是否采纳AI的建议，但不使用AI“越来越像自愿放弃一种能帮助患者的重要工具。”

该论文作者之一，医学博士Liam McCoy也表示，AI尤其适合执行鉴别诊断的任务，这类任务富有创造性，且高度依赖联想。

挑战与展望：

尽管o1-preview模型在医疗诊断领域展现出了巨大的潜力，但仍面临一些挑战。例如，如何确保AI诊断的公平性和避免偏见，以及如何保护患者的隐私等问题。

然而，不可否认的是，AI正在重塑医疗诊断流程。未来，AI医生或将广泛应用于临床实践，为患者提供更精准、更高效的医疗服务。正如沃顿教授Ethan Mollick所言，拒绝AI辅助如同“放弃重要工具”。这场变革的核心，或许不在于谁更优秀，而在于如何让人类医生的经验与AI的精准形成合力。

参考文献：

Mollick, E. [@emollick]. (2024). Twitter post. X. https://x.com/emollick/status/1925362565946786206
https://arxiv.org/pdf/2412.10849

（完）

>>> Read more <<<

一	二	三	四	五	六	日
1	2	3	4	5	6	7
8	9	10	11	12	13	14
15	16	17	18	19	20	21
22	23	24	25	26	27	28
29	30

Hinton梦想成真？AI医生斯坦福哈佛实测超人类

作者智能小编

相关文章

永新光学 (603297.SH) ：国产替代与新兴业务驱动下的价值重估

来伊份：转型阵痛中的价值重塑与未来突围

北方稀土 (600111.SH): 战略核心资产的价值重估——迎接“戴维斯双击”

发表回复取消回复

为您推荐