news studionews studio

摘要: 曾经引领国内大模型浪潮的MiniMax,在推理模型竞赛中落后。面对DeepSeek R1的强势崛起,MiniMax创始人闫俊杰不甘示弱,押注自研推理模型,试图重塑技术底色。然而,资源分散、架构豪赌以及应用布局的广泛性,都给MiniMax带来了挑战。这家估值超40亿美元的AI明星企业,能否凭借自研推理模型成功突围?

北京 – 2025年6月9日,曾经被誉为“AI六小龙”的国内大模型创业公司,如今已演变为“AI四小强”的竞争格局。智谱AI、月之暗面、阶跃星辰相继推出自研推理模型后,MiniMax也即将发布筹备已久的文本推理模型。

MiniMax的创始人兼CEO闫俊杰,曾经以其前瞻性的技术押注引领行业风向。2023年下半年,当大多数国内大模型厂商还在迭代稠密模型时,闫俊杰就将大量资源投入到MoE(Mixture of Experts 混合专家模型)的研发中。2024年1月,MiniMax上线的abab6成为国内首个MoE大模型,引领了行业的技术迭代方向。

然而,在DeepSeek R1掀起的推理模型浪潮中,MiniMax却成了追赶者。面对竞争对手的强势表现,MiniMax选择了一种折中方案:国内C端应用不接入DeepSeek,坚持等到自研推理模型上线。这一策略与字节跳动类似,后者同样选择不在国内主力C端应用豆包上接入DeepSeek,而是等待自研推理模型的上线。

推理模型缺失的影响

推理模型的缺失,正在从多个方面影响着MiniMax的发展。

首先,外界对其高估值和后续融资的可持续性产生质疑。2024年3月,MiniMax完成6亿美元A轮融资后,投后估值达到25亿美元。虽然有传闻称其估值已超过40亿美元,但资本市场开始重新评估MiniMax的估值体系。

其次,深度思考能力的短板使得MiniMax在应用侧难以吸引并聚拢更多用户。由于国内应用坚持不接入DeepSeek,这一难题被进一步放大。相比之下,腾讯元宝靠着率先接入DeepSeek,月活用户迅速攀升至行业TOP3。

此外,B端业务也受到影响。由于无法提供推理模型选项,MiniMax可能会被迫将更多模型调用需求推向竞争对手。

豪赌架构创新

MiniMax推理模型未能更早上线的原因,部分要归因于闫俊杰更大的赌性。当DeepSeek、Kimi们着手研发推理模型之际,MiniMax则将重心放在了架构创新上。

2024年1月15日,MiniMax发布了MiniMax-01并正式开源,首次在4000亿以上参数的大模型中使用了线性注意力架构Linear Attention。官方称,该架构能高效处理全球最长的400万token上下文。

闫俊杰将筹码再次押在了Linear Attention上。然而,R1的发布,给了MiniMax一个措手不及。“我们发现融入这些推理能力,模型的外推能力显著提升,泛化能力更好。”MiniMax高级研究总监钟怡然表示。

为了追赶行业新态势,MiniMax的模型研发团队在春节期间赶工,试图加快推理模型上线。“内部给出的目标是,要做出比R1更好、甚至要达到o1或o3相近水准的推理模型,且实现多模态推理能力。”

多线布局的挑战

除了押注新架构带来的资源分散之外,在应用上的豪赌布局也分散了MiniMax追求模型迭代的精力。AI四小强中,MiniMax的布局几乎最广:既做To C,又做to B;既做国内,又做海外。庞大的业务策略,无疑给MiniMax带来了更大的挑战。

结论

面对激烈的市场竞争,MiniMax能否凭借自研推理模型成功突围,仍充满不确定性。这家曾经引领行业风向的AI明星企业,需要在技术创新、应用落地和资源整合方面做出更加明智的选择。

参考文献

致谢

感谢字母榜提供的信息,以及各位专家对本文的贡献。


>>> Read more <<<

Views: 0

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注