DeepSeek R1T2：TNG推出更强AI语言模型

作者智能小编

7 月 5, 2025 #DeepSeek, #r1t2, #每日AI快讯

北京讯 – 人工智能领域再添新秀。TNG公司近日推出了一款基于DeepSeek原始模型的改进型AI语言模型——DeepSeek R1T2。这款模型在继承了DeepSeek系列强大能力的基础上，实现了推理速度的大幅提升，并有效控制了计算成本，为企业级应用提供了更具性价比的选择。

Tri-Mind架构：融合多重优势

DeepSeek R1T2最引人注目的特点是其创新的Tri-Mind（三心智）架构。该架构巧妙地融合了DeepSeek R1-0528、R1和V3-0324三个父模型的优势：R1-0528的强大推理能力、R1的结构化思维模式以及V3-0324的简洁指令导向行为。这种融合使得R1T2在处理复杂任务时能够兼顾智能与效率。

TNG公司采用了一种名为Assembly of Experts（AoE）的技术来实现Tri-Mind架构。与传统的混合专家（MoE）架构不同，AoE在权重张量层面进行融合，而非在运行时动态激活专家。这种方法使得R1T2能够继承父模型的推理强度，同时显著降低冗余输出，从而提升速度和效率。

速度提升与成本控制：企业级应用的理想选择

DeepSeek R1T2在速度上的提升令人印象深刻。据官方数据，R1T2的推理速度比R1-0528快200%，比R1快20%。更重要的是，R1T2的输出token长度减少了60%，这意味着在实际应用中，推理时间和计算成本都将大幅降低。

在智能基准测试中，R1T2的表现也毫不逊色。尽管在输出长度上进行了优化，但R1T2在GPQA Diamond和AIME-2024/2025等测试中的表现仍然达到了R1-0528智能水平的90%至92%，远超R1。

TNG公司表示，R1T2尤其适用于需要推理能力且对速度和成本敏感的企业级应用，是R1的理想升级替代品。

开源与可定制性：助力AI生态发展

为了促进AI技术的普及和发展，DeepSeek R1T2已在Hugging Face上开源，并遵循MIT许可协议。这意味着开发者可以自由地对R1T2进行微调、强化学习和私有部署，从而满足各种不同的应用需求。

应用场景广泛：从教育到金融

DeepSeek R1T2的应用场景非常广泛，涵盖了多个领域：