AI科学家2.0：自主科研，论文自产！

摘要： 由Sakana AI、不列颠哥伦比亚大学、Vector研究所等机构联合推出的The AI Scientist-v2（AI科学家2.0）系统，成功实现了从科学假设提出、实验设计与执行、数据分析与可视化，到科学论文撰写的全流程自动化。该系统生成的论文通过了ICLR 2025研讨会的同行评审，标志着AI在科学研究领域取得了里程碑式的突破。

北京/多伦多 [日期] – 在人工智能领域不断突破的浪潮中，一项颠覆性的创新正在重塑科学研究的未来。The AI Scientist-v2，一个由Sakana AI、不列颠哥伦比亚大学和Vector研究所等机构联合开发的通用端到端AI系统，已经证明了其自主完成科学研究全流程的能力，并成功撰写了一篇通过同行评审的科学论文。

AI科学家2.0：科学研究的新范式

The AI Scientist-v2并非简单的工具，而是一个能够独立思考、实验和总结的“虚拟科学家”。与前代版本相比，AI科学家2.0摆脱了对人类编写代码模板的依赖，引入了基于代理的树搜索方法，从而能够更系统地探索科学假设。它整合了视觉-语言模型（VLM）反馈循环，显著提高了生成内容的质量和清晰度。

该系统的核心功能包括：

自主提出科学假设： 能够像人类科学家一样，提出新颖的研究方向和问题。
设计和执行实验： 自动设计实验流程，执行数据收集和处理。
数据分析和可视化： 分析实验数据，生成图表和可视化结果，帮助理解实验发现。
撰写科学论文： 撰写完整的科学论文，包括摘要、引言、方法、实验结果和结论等部分。

技术原理：多重创新驱动

AI科学家2.0的成功，源于其独特的技术架构：

基于代理的树搜索： 系统采用一种新颖的树搜索算法，通过实验管理代理（Experiment Progress Manager）分阶段管理实验过程。每个阶段都有明确的目标和停止条件，例如初步调查、超参数调整、研究议程执行和消融研究。这种方法支持系统并行探索多个实验路径，显著加速科学发现的过程。
视觉-语言模型（VLM）反馈： 在实验和论文撰写阶段，系统利用VLM对生成的图表和文本进行评估和反馈。VLM能够检查图表的清晰度、标签的准确性以及文本描述的一致性，确保生成的内容质量高且科学准确。
代码生成和执行： 系统自动生成实验代码，并在Python解释器中执行。如果代码执行出错，系统记录错误信息并尝试调试，确保实验的顺利进行。
数据加载和处理： 系统使用Hugging Face Hub自动下载和加载常用的数据集，简化数据处理流程。实验数据被保存为结构化的numpy文件，便于后续的分析和可视化。
多阶段实验管理： 实验管理代理将实验过程分为多个阶段，每个阶段都有明确的目标和评估标准。

应用前景：重塑科研生态

AI科学家2.0的出现，预示着科学研究领域即将迎来一场深刻的变革。其潜在应用场景十分广泛：