AI发论文冲顶会！同行评审给出高分！

华盛顿特区 — 人工智能（AI）在科学研究领域的应用正迎来新的突破。近日，人工智能初创公司Sakana AI发布了其AI Scientist的最新版本——AI Scientist-v2，并声称其生成的论文已达到被顶级AI会议接收的水平。这一消息引发了学术界和科技界的广泛关注。

据Sakana AI介绍，AI Scientist-v2生成的论文《Compositional Regularization: Unexpected Obstacles in Enhancing Neural Network Generalization》在国际学习表征会议（ICLR）2025的研讨会上获得了6/7/6的同行评审分数。这一分数超过了平均接受阈值，甚至优于许多人类撰写的论文。据悉，这篇论文也是首篇完全由AI生成并通过顶级机器学习会议研讨会同行评审的学术论文。

AI Scientist-v2的技术创新

AI Scientist-v2相较于第一代版本，在自主性和泛化能力方面有了显著提升。主要创新包括：

更通用的想法生成阶段： AI Scientist-v2不再依赖于固定的、人工编写的实验模板代码，而是从更抽象的层次开始，鼓励对潜在的研究方向、假设和实验设计进行更开放的思考。这一过程类似于在确定具体实施方案之前制定研究摘要或资助提案。
粗粒度实验管理和基于智能体树搜索的探索： 为了模拟现实世界中科学实验的不同阶段，Sakana AI团队引入了一个实验进度管理智能体，用于协调科学实验的四个明确定义的阶段：初步调查、超参数调优、研究议程执行、消融研究。同时，AI Scientist-v2采用了更加灵活和探索性的方法，研究人员将智能体树搜索方法融入实验阶段，从而能够更深入、更系统地探索科学假设。
视觉语言模型（VLM）的集成： AI Scientist-v2将视觉语言模型集成到实验和评审阶段，进一步提升了其理解和处理复杂数据的能力。
简化的稿件撰写阶段： AI Scientist-v2将第一代版本中基于Aider的增量式迭代写作方法替换为更简单的单次生成，并随后进行由GPT等推理模型驱动的独立反思阶段。

技术细节

Sakana AI在技术报告《The AI Scientist-v2: Workshop-Level Automated Scientific Discovery via Agentic Tree Search》中详细介绍了AI Scientist-v2的技术细节，并开源了其代码。

报告指出，AI Scientist-v2的关键概念转变在于研究创意生成方法的革新。与前代系统主要侧重于基于现有代码库提出增量式修改或扩展不同，AI Scientist-v2采用了从更高抽象层次开始的流程。该系统鼓励对潜在的研究方向、假设和实验设计进行更开放的思考，类似于在确定具体实施方案之前制定研究摘要或资助提案。

此外，AI Scientist-v2还尽可能地利用Hugging Face Hub，并使用标准的单行函数（datasets.load_dataset）自动下载所需的数据集。

挑战与展望

尽管AI Scientist-v2取得了显著进展，但其在科学研究领域的应用仍面临诸多挑战。例如，如何确保AI生成的论文的原创性和可靠性？如何避免AI在研究过程中产生偏见？如何让人类研究人员更好地与AI协同工作？

尽管如此，AI在科学研究领域的潜力不容忽视。随着技术的不断发展，我们有理由相信，AI将在未来的科学研究中发挥越来越重要的作用，加速科学发现的进程，为人类社会带来更多福祉。

参考文献：

Sakana AI. (2025). The AI Scientist-v2: Workshop-Level Automated Scientific Discovery via Agentic Tree Search. Retrieved from https://pub.sakana.ai/ai-scientist-v2/paper/paper.pdf
SakanaAI/AI-Scientist-v2. GitHub. Retrieved from https://github.com/SakanaAI/AI-Scientist-v2

>>> Read more <<<

一	二	三	四	五	六	日
1	2	3	4	5	6	7
8	9	10	11	12	13	14
15	16	17	18	19	20	21
22	23	24	25	26	27	28
29	30

AI发论文冲顶会！同行评审给出高分！

作者智能小编

AI Scientist-v2的技术创新

技术细节

挑战与展望

相关文章

永新光学 (603297.SH) ：国产替代与新兴业务驱动下的价值重估

来伊份：转型阵痛中的价值重塑与未来突围

北方稀土 (600111.SH): 战略核心资产的价值重估——迎接“戴维斯双击”

发表回复取消回复

为您推荐

永新光学 (603297.SH) ：国产替代与新兴业务驱动下的价值重估

来伊份：转型阵痛中的价值重塑与未来突围

北方稀土 (600111.SH): 战略核心资产的价值重估——迎接“戴维斯双击”

国之重器，芯之所向：新周期与大国博弈下的中芯国际(688981.SH)价值重估

作者智能小编

AI Scientist-v2的技术创新

技术细节

挑战与展望

相关文章

发表回复 取消回复

为您推荐

发表回复取消回复