DeepSeek发布Prover-V2：数学推理新突破

北京 – 中国人工智能公司DeepSeek（深度求索）近日发布了其最新的开源数学推理大模型DeepSeek-Prover-V2，该模型在数学推理能力上取得了显著突破，尤其是在形式化定理证明方面。这一进展有望为教育、科研、工程设计等多个领域带来新的可能性。

DeepSeek-Prover-V2包含两个版本，分别是拥有6710亿参数的DeepSeek-Prover-V2-671B和70亿参数的DeepSeek-Prover-V2-7B。作为Prover-V1.5的升级版，V2版本采用了混合专家系统（MoE）架构，支持超长上下文和多精度计算，能够将自然语言问题转化为形式化证明代码。更重要的是，它集成了先进的多头潜注意力（MLA）架构，通过压缩键值缓存（KV Cache）显著降低了推理过程中的内存占用和计算开销。

据DeepSeek介绍，Prover-V2的训练过程采用了递归定理证明管道生成数据，并结合三阶段训练范式：预训练、数学专项训练和人类反馈强化学习微调。这种训练方式使其在数学推理数据集上表现卓越，形式化定理证明通过率高达88.9%。为了更好地评估模型性能，DeepSeek还发布了DeepSeek-ProverBench数据集。

技术亮点：多头潜注意力与混合专家系统

DeepSeek-Prover-V2的技术核心在于其多头潜注意力（MLA）架构和混合专家（MoE）架构。MLA架构通过压缩键值缓存，有效降低了推理过程中的内存占用和计算开销，使得模型在资源受限的环境下也能高效运行。MoE架构则通过结合强化学习与大规模合成数据，提升了自动化证明能力。

此外，该模型还使用了更高效的safetensors文件格式，并支持BF16、FP8、F32等多种计算精度，方便模型更快、更省资源地进行训练和部署。其最长支持163,840 tokens的上下文窗口，使其能够处理大规模、长逻辑链条的数学证明任务。

应用前景广阔：教育、科研、工程设计等多领域受益

DeepSeek-Prover-V2的应用场景十分广泛：