智谱发布GLM-4.5：推理、代码与智能体新突破

引言

想象一下，一个能够同时进行复杂推理、生成高质量代码，并且支持智能体应用的AI模型，它的出现将会给人工智能领域带来怎样的变革？近日，智谱AI推出了新一代旗舰模型——GLM-4.5，这是首款原生融合推理、代码和智能体能力的开源SOTA（State Of The Art）模型。GLM-4.5不仅在多个评测基准中表现卓越，还以其高效的参数利用和低成本、高速度的特点，引发了业界的广泛关注。

GLM-4.5是什么？

GLM-4.5是智谱AI推出的新一代旗舰模型，专为智能体应用打造。它是首款原生融合推理、代码和智能体能力的开源SOTA模型。GLM-4.5采用了混合专家（MoE）架构，有两个版本：GLM-4.5（3550亿参数，320亿激活）和GLM-4.5-Air（1060亿参数，120亿激活）。模型在多个评测基准中表现卓越，综合性能达到开源模型的顶尖水平，尤其在代码智能体场景中表现优异。

GLM-4.5的主要特点

多能力融合

GLM-4.5首次在单个模型中实现了推理、代码生成和智能体能力的原生融合，能满足复杂智能体应用的需求。这意味着开发者可以在一个模型中实现多种功能，大大提高了开发效率和应用场景的广泛性。

推理能力

GLM-4.5在多个推理评测基准中表现优异，支持复杂推理任务，推理性能达到开源模型的顶尖水平。这使得GLM-4.5在处理复杂任务时表现出色，能够胜任各种高难度的推理任务。

代码生成

GLM-4.5在代码生成和编程任务中表现出色，支持多种编程语言，能生成高质量的代码片段，胜任全栈开发任务。这为开发者提供了强大的工具，使得代码生成和编程变得更加高效和便捷。

智能体应用

GLM-4.5支持工具调用、网页浏览等功能，能接入代码智能体框架，如Claude Code和Roo Code，适用于智能体任务。这使得GLM-4.5在智能体应用中具有广泛的适用性，能够处理各种复杂的任务和场景。

混合推理模式

GLM-4.5提供“思考模式”用于复杂推理和工具使用，以及“非思考模式”用于即时响应，兼顾效率和性能。这使得GLM-4.5在不同应用场景中都能表现出色，无论是需要深度思考的复杂任务，还是需要快速响应的即时任务。

GLM-4.5的技术亮点

混合专家（MoE）架构

GLM-4.5采用了混合专家（Mixture of Experts, MoE）架构，这是一种高效的模型扩展方法。MoE架构通过将模型参数划分为多个专家模块（Experts），在每个前向传播过程中动态选择部分专家进行激活，实现参数的稀疏激活。在保持模型强大表达能力的同时，显著降低了计算成本和内存占用。

多模态能力

GLM-4.5支持多模态输入和输出，能处理文本、图像等多种数据类型。这使得模型能更好地理解和生成复杂的智能体应用内容，例如在智能体任务中处理网页浏览、工具调用等多模态交互场景。

高效的训练流程

GLM-4.5的训练流程包括三个阶段：
1. 通用数据预训练：在15万亿token的通用数据上进行预训练，以学习语言和知识的基础表示。
2. 针对性训练：在代码、推理、智能体等领域的8万亿token数据上进行针对性训练，以增强模型在特定任务上的表现。
3. 强化学习优化：通过强化学习进一步优化模型的推理、代码生成和智能体能力，以提升模型在实际应用中的表现。

参数效率优化

GLM-4.5在参数效率上实现了显著提升。尽管参数量仅为DeepSeek-R1的1/2和Kimi-K2的1/3，但在多项标准基准测试中表现得更为出色。例如，在100B总参数–10B激活参数规模的模型

>>> Read more <<<

一	二	三	四	五	六	日
1	2	3	4	5	6	7
8	9	10	11	12	13	14
15	16	17	18	19	20	21
22	23	24	25	26	27	28
29	30

智谱发布GLM-4.5：推理、代码与智能体新突破

作者智能小编

引言

GLM-4.5是什么？