憋大招，MiniMax发布全球首个混合架构开源模型M1 能后来者居上吗？

更新时间：2025-06-18 01:48:59 浏览次数：

　　总部位于上海的人工智能独角兽企业MiniMax突然放了个大招。

　　6月17日，MiniMax正式发布其自主研发的MiniMax-M1系列模型。根据MiniMax方面的介绍，M1被定义为“全球首个开源的大规模混合架构推理模型”。

　　此外，技术报告显示：M1模型在处理百万Token级长文本的能力方面实现了重大突破，成为上下文最长的推理模型；其RL成本下降一个量级，成本仅53万美金，推理效率则数倍于竞争对手。

　　今年开年以来，DeepSeek持续冲击着大模型行业的格局，接入DeepSeek-R1一度被很多企业视为拥抱AI的标志。

　　如今，MiniMax推出号称具备“全球最长上下文”的M1模型，有可能后来者居上吗？

　　百度正式发布“文心大模型4.5”“文心大模型X1”。据介绍，文心大模型4.5是百度首个原生多模态大模型，API调用价格仅为GPT-4.5的1%。文心大模型X1为深度思考模型，性能对标DeepSeek-R1，调用价格约为其一半。

　　大模型还有优化空间，谁找对方向就是下一科技巨头

　　或许可以说，M1是MiniMax憋了许久的大招之一。

　　在DeepSeek的冲击之下，大模型创业公司今年一开年就面对着战略方向的转折点：是做技术还是做产品？

　　今年1月，MiniMax创始人兼CEO闫俊杰在接受媒体时表示，在更明确“智能水平的提升，没那么依赖很多用户”后，他做出了取舍，结束了整整半年多的焦虑。闫俊杰明确，现在MiniMax最重要的目标不是增长，也不是收入，是“加速技术迭代”。

　　同样在1月，MiniMax发布并开源新一代“01系列”模型，包含基础语言大模型“MiniMax-Text-01”和到了3月，MiniMax对品牌进行了更清晰的拆分，据悉，MiniMax将旗下AI应用“海螺AI”正式更名为“MiniMax”，国内版和国际版同步调整。

　　5月，MiniMax发布新一代语音大模型“Speech-02”。据介绍，基于超强技术与足够泛化的模型能力，Speech-02为用户带来超拟人、个性化、多样性的语音服务。

　　虽说在重要性上让步于技术攻坚，但在商业化上，MiniMax在B端和C端上皆有布局，对国内市场和海外市场皆有涉猎。

　　此外，在今年1月发布并开源新一代01系列模型时，MiniMax方面便提及，2025年，AI将迎来至关重要的发展节点，AI Agent有望成为新一年最重要的产品形态，引领AI从传统的“工具”角色向更具互动性与协作性的“伙伴”角色转变。

　　当时，MiniMax便表示：“首先，我们认为这有可能启发更多长上下文的研究和应用，从而更快促进Agent时代的到来；第二，开源也能促使我们努力做更多创新，更高质量地开展后续的模型研发工作。”

　　国泰海通证券在近期的研报中提及，大模型在多模态理解和复杂推理上的突破，为AI Agent的发展提供了核心技术支撑。AI 应用虽尚处于落地初期，但未来发展路径明晰，当前处于B端萌芽期，未来C端有望大规模爆发，最终将实现B端与C端并行发展，全面推动AI产业繁荣。

　　MiniMax刚刚推出的M1是否能助力其在AI Agent这一方向上的发展？对此，盘和林肯定其“有帮助”，但认为还没有到革命性的程度，属于渐进性算法优化。

　　早在今年1月接受时，闫俊杰就明确了技术和产品的关系，他表示，更好的模型可以导向更好的应用，但更好的应用和更多用户并不会导向更好的模型。

　　在DeepSeek火爆全网时，MiniMax坚持将目标定为“加速技术迭代”。半年后，MiniMax终于来到了自己的“主场时刻”。据就MiniMax坚持技术攻坚的前景，盘和林表示，他看好加码大模型的创业公司。盘和林进一步分析说：“现阶段的基础模型依然有很大的提升空间，很多用户并不喜欢用AI来干活，因为AI不聪明且很慢。之前，有人用所谓的智能体来生成报告，这些智能体却用了数天乃至数周的时间还没有完成，这效率并不比真人高。如今很多人用AI，也只能解决一部分工作，无法做到直接交付工作的程度。”

　　在盘和林看来，大模型一定还有优化空间，谁找对了大模型算法优化的方向，谁就是下一个科技巨头。“DeepSeek向前走了一步，但还不够。”盘和林说。

推荐图文