上海讯——在2025世界人工智能大会(WAIC 2025)上,上海人工智能实验室(上海AI实验室)重磅发布并开源了“书生”科学多模态大模型Intern-S1,标志着人工智能在科学研究领域应用迈出了关键一步。这款模型是首个融合专业科学能力的开源通用模型,具备强大的跨模态科学解析能力,能够精准解读化学分子式、蛋白质结构、地震波信号等多种复杂科学模态数据。
突破性进展:超越顶尖闭源模型
Intern-S1在化学、材料、地球科学等多个学科的专业任务基准上,性能超越了顶尖闭源模型Grok-4,充分展示了其卓越的科学推理与理解能力。这一突破性进展有望改变科研人员的工作方式,加速科学发现的进程。
科研领域的AI伙伴
长期以来,科研领域一直期待着一个真正“懂科学”的AI伙伴。尽管当前主流模型在自然语言处理、图像识别等方面表现出色,但在面对复杂、精细且高度专业化的科研任务时,仍然存在明显短板。Intern-S1的出现,正是为了弥补这一空白。
该模型首创“跨模态科学解析引擎”,能够精准解读多种复杂科学模态数据,并具备预测化合物合成路径、判断化学反应可行性、识别地震波事件等多项前沿科研能力。这使得AI从“对话助手”进化为“科研搭档”,助力全面重构科研生产力。
“全能高手”与“科学明星”
Intern-S1不仅在科学领域表现出色,在多模态综合能力方面也同样亮眼,全面领先InternVL3、Qwen2.5-VL等主流开源模型,堪称“全能高手”中的“科学明星”。
助力靶标发现与临床转化
基于Intern-S1强大的跨模态生物信息感知与整合能力,上海AI实验室联合临港实验室、上海交通大学、复旦大学、MIT等研究机构,共同构建了多智能体虚拟疾病学家系统——“元生”(OriGene)。该系统可用于靶标发现与临床转化价值评估,已在肝癌和结直肠癌治疗领域上分别提出新靶点GPR160和ARG2,并经过真实临床样本和动物实验验证,形成科学闭环。
技术创新:通专融合
Intern-S1的卓越性能得益于体系化的技术创新。自书生大模型首次发布以来,上海AI实验室已逐步构建起丰富的书生大模型家族,包括大语言模型书生·浦语InternLM、多模态模型书生·万象InternVL、强推理模型书生·思客 InternThinker等。基于“通专融合”的技术路线,上海AI实验室的研究团队通过持续的体系化技术创新,成功打造了Intern-S1,成为新一代模型标杆。
创新架构:深度融合多种科学模态数据
为了更好地适应科学数据,Intern-S1新增了动态Tokenizer和时序信号编码器,可支持多种复杂科学模态数据,实现了材料科学与化学分子式、生物制药领域的蛋白质序列、天文巡天中的光变曲线、天体碰撞产生的引力波信号、地震台网记录的地震波形等多种科学模态的深度融合。通过架构创新,Intern-S1还实现了对科学模态数据的深入理解与高效处理。
数据合成:一个模型解决多项专业任务
为了解决科学领域高价值任务高度专业化的问题,研究团队提出了通专融合的科学数据合成方法:一方面利用海量通用科学数据拓展模型的知识面,另一方面训练众多专业模型生成具有高可读性、思维路径清晰的科学数据,并由领域定制的专业验证智能体进行数据质量控制。最终,这一闭环机制持续反哺基座模型,使其同时具备强大的通用推理能力与多项顶尖的专业能力。
强化学习:成本直降10倍
Intern-S1研发团队在训练系统与算法层面协同突破,成功实现了大型多模态MoE模型在FP8精度下的高效稳定强化学习训练,其强化学习训练成本相比近期公开的MoE模型降低10倍。
坚持开源:打造更懂科学的AI助手
书生大模型自2023年正式开源以来,已陆续迭代升级多个版本,并持续降低大模型应用及研究门槛。上海AI实验室进一步开源了多智能体框架Intern·Agent,可广泛应用于化学、物理、生物等领域。
Intern-S1的发布和开源,将为科研人员提供强大的AI工具,加速科学发现的进程,并推动人工智能在科学研究领域的广泛应用。
相关链接:
- Intern-S1体验页面:https://chat.intern-ai.org.cn/
- GitHub链接:https://github.com/InternLM/Intern-S1
- HuggingFace链接:https://huggingface.co/internlm/Intern-S1-FP8
- ModelScope链接:https://modelscope.cn/models/ShanghaiAILaboratory/Intern-S1
Views: 1