Agentica联手Together AI，开源DeepCoder-14B代码模型

摘要： Agentica 与 Together AI 联合开源 DeepCoder-14B-Preview，一款基于 Deepseek-R1-Distilled-Qwen-14B 微调的代码生成模型。该模型在 LiveCodeBench 上达到 60.6% 的准确率，媲美 OpenAI 的 o3-mini，为代码生成领域带来新的突破。

北京 – 在人工智能代码生成领域，一项重要的合作成果近日正式亮相。Agentica 与 Together AI 宣布联合开源 DeepCoder-14B-Preview，这是一款强大的代码生成模型，旨在降低强化学习（RL）在大型语言模型（LLM）中的应用门槛，并促进社区的蓬勃发展。

DeepCoder-14B-Preview 基于 Deepseek-R1-Distilled-Qwen-14B 模型进行微调，后者是一个经过蒸馏优化的 140 亿参数预训练模型，具备强大的语言理解和生成能力。该模型的核心亮点在于其基于分布式强化学习（RL）的训练方式，使其在代码生成任务上表现出色。尤其值得一提的是，DeepCoder-14B-Preview 在 LiveCodeBench 上达到了 60.6% 的准确率，这一成绩足以与 OpenAI 的 o3-mini 相媲美，标志着开源代码生成模型的一次重大飞跃。

DeepCoder-14B-Preview 的主要功能：

高质量代码生成： 能够生成高质量、可运行的代码，适用于多种编程语言和场景。
代码问题解决： 能够解决复杂的编程问题，包括算法设计、数据结构优化等。
代码补全与优化： 提供代码补全功能，帮助开发者快速完成代码编写，并优化现有代码提高效率。
单元测试生成： 自动生成单元测试代码，确保生成代码的准确性和可靠性。
代码调试辅助： 帮助开发者定位和修复代码中的错误，提高开发效率。
跨平台适用性： 支持多种编程环境和平台，具有广泛的适用性。

技术原理剖析：

DeepCoder-14B-Preview 的成功并非偶然，其背后蕴含着一系列精巧的技术设计：

基础模型： Deepseek-R1-Distilled-Qwen-14B 提供了强大的语言理解和生成能力，为代码生成奠定了坚实的基础。
强化学习微调： 基于分布式强化学习（RL）对基础模型进行微调，通过奖励机制引导模型生成更高质量的代码，确保代码的准确性和效率。
高质量数据集： 使用经过严格筛选的 24K 个可验证编程问题进行训练，数据来源包括 TACO Verified、PrimeIntellect 的 SYNTHETIC-1 数据集及 LiveCodeBench 提交的问题，保证了训练数据的质量。
奖励函数设计： 基于稀疏结果奖励模型（ORM），只有当生成的代码通过所有采样单元测试时才给予奖励，避免模型通过记忆测试用例来获取奖励。
上下文扩展技术： 迭代上下文扩展技术，模型从较短的上下文长度开始学习，逐步泛化到更长的上下文，最终在 64K 上下文中达到 60.6% 的准确率。
系统优化： 引入 verl-pipeline，基于流水线技术加速训练过程，减少训练时间，提高训练效率。

应用场景展望：

DeepCoder-14B-Preview 的开源，无疑将为代码生成和自动化编程领域带来新的机遇：

代码生成与自动化编程： 快速生成高质量代码，减少手动编写代码的时间和工作量，提高开发效率。
算法竞赛与问题解决： 在算法竞赛（如 Codeforces）中，帮助参赛者快速理解问题并生成高效的解决方案，提升竞赛表现。
代码优化与重构： 对现有代码进行优化和重构，提高代码的可读性、性能和可维护性。
教育与学习辅助： 作为编程教育工具，帮助学生理解和实践编程概念，提供代码示例和解决方案。
软件开发与测试： 生成单元测试代码，确保软件质量；辅助开发过程中的代码调试，帮助开发者快速定位和解决问题。

项目地址：

项目官网：https://pretty-radio-b75.notion.site/DeepCoder-A-Fully-Open-Source-14B-Coder
HuggingFace模型库：https://huggingface.co/agentica-org/DeepCoder-14B-Preview

结论：

DeepCoder-14B-Preview 的开源，不仅为开发者提供了一个强大的代码生成工具，更重要的是，它推动了强化学习在大型语言模型中的应用，降低了技术门槛，促进了社区的共同发展。随着更多开发者和研究人员的参与，DeepCoder-14B-Preview 有望在代码生成领域发挥更大的作用，为软件开发带来革命性的变革。

未来展望：

未来，我们可以期待 DeepCoder-14B-Preview 在以下几个方面取得进一步突破：

更高的准确率和效率： 通过持续优化模型结构和训练方法，进一步提高代码生成的准确率和效率。
更广泛的语言支持： 扩展对更多编程语言的支持，满足不同开发者的需求。
更智能的代码理解： 提升模型对代码意图的理解能力，生成更符合开发者需求的代码。
更强大的调试能力： 提供更强大的代码调试辅助功能，帮助开发者快速定位和解决问题。

DeepCoder-14B-Preview 的开源，是人工智能代码生成领域的一个重要里程碑，它将为开发者带来更多便利，并推动整个行业的发展。

参考文献：

Agentica. (n.d.). DeepCoder-A-Fully-Open-Source-14B-Coder. Retrieved from https://pretty-radio-b75.notion.site/DeepCoder-A-Fully-Open-Source-14B-Coder
Agentica-org. (n.d.). DeepCoder-14B-Preview. Retrieved from https://huggingface.co/agentica-org/DeepCoder-14B-Preview
AI工具集. (n.d.). DeepCoder-14B-Preview – Agentica 联合 Together AI 开源的代码生成模型. Retrieved from (Original URL)

>>> Read more <<<