90年代的黄河路

华盛顿特区 — 人工智能(AI)在科学研究领域的应用正迎来新的突破。近日,人工智能初创公司Sakana AI发布了其AI Scientist的最新版本——AI Scientist-v2,并声称其生成的论文已达到被顶级AI会议接收的水平。这一消息引发了学术界和科技界的广泛关注。

据Sakana AI介绍,AI Scientist-v2生成的论文《Compositional Regularization: Unexpected Obstacles in Enhancing Neural Network Generalization》在国际学习表征会议(ICLR)2025的研讨会上获得了6/7/6的同行评审分数。这一分数超过了平均接受阈值,甚至优于许多人类撰写的论文。据悉,这篇论文也是首篇完全由AI生成并通过顶级机器学习会议研讨会同行评审的学术论文。

AI Scientist-v2的技术创新

AI Scientist-v2相较于第一代版本,在自主性和泛化能力方面有了显著提升。主要创新包括:

  • 更通用的想法生成阶段: AI Scientist-v2不再依赖于固定的、人工编写的实验模板代码,而是从更抽象的层次开始,鼓励对潜在的研究方向、假设和实验设计进行更开放的思考。这一过程类似于在确定具体实施方案之前制定研究摘要或资助提案。
  • 粗粒度实验管理和基于智能体树搜索的探索: 为了模拟现实世界中科学实验的不同阶段,Sakana AI团队引入了一个实验进度管理智能体,用于协调科学实验的四个明确定义的阶段:初步调查、超参数调优、研究议程执行、消融研究。同时,AI Scientist-v2采用了更加灵活和探索性的方法,研究人员将智能体树搜索方法融入实验阶段,从而能够更深入、更系统地探索科学假设。
  • 视觉语言模型(VLM)的集成: AI Scientist-v2将视觉语言模型集成到实验和评审阶段,进一步提升了其理解和处理复杂数据的能力。
  • 简化的稿件撰写阶段: AI Scientist-v2将第一代版本中基于Aider的增量式迭代写作方法替换为更简单的单次生成,并随后进行由GPT等推理模型驱动的独立反思阶段。

技术细节

Sakana AI在技术报告《The AI Scientist-v2: Workshop-Level Automated Scientific Discovery via Agentic Tree Search》中详细介绍了AI Scientist-v2的技术细节,并开源了其代码。

报告指出,AI Scientist-v2的关键概念转变在于研究创意生成方法的革新。与前代系统主要侧重于基于现有代码库提出增量式修改或扩展不同,AI Scientist-v2采用了从更高抽象层次开始的流程。该系统鼓励对潜在的研究方向、假设和实验设计进行更开放的思考,类似于在确定具体实施方案之前制定研究摘要或资助提案。

此外,AI Scientist-v2还尽可能地利用Hugging Face Hub,并使用标准的单行函数(datasets.load_dataset)自动下载所需的数据集。

挑战与展望

尽管AI Scientist-v2取得了显著进展,但其在科学研究领域的应用仍面临诸多挑战。例如,如何确保AI生成的论文的原创性和可靠性?如何避免AI在研究过程中产生偏见?如何让人类研究人员更好地与AI协同工作?

尽管如此,AI在科学研究领域的潜力不容忽视。随着技术的不断发展,我们有理由相信,AI将在未来的科学研究中发挥越来越重要的作用,加速科学发现的进程,为人类社会带来更多福祉。

参考文献:


>>> Read more <<<

Views: 0

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注