“基模五强”接棒“六小虎”时代，谁在重塑国产大模型竞争格局？

更新时间：2025-05-12 15:39:30 浏览次数：

　　投资、五源资本、启明创投等，显示出上海市对其的全力支持。而智谱AI也获得了北京市海淀区政府的市场化投资平台中关村科学城的多次加注。

　　人才密度是大模型竞争的决胜高地，“基模五强”均汇聚了业内顶尖的技术领军人物和高素质人才团队。

　　字节跳动在张一鸣亲自督战AI后，广纳贤才，吸引了包括零一万物原联创黄文灏、阿里通义大模型原技术负责人周畅等一批业界精英。阿里由集团CEO吴泳铭统管AI战略，阿里云CTO周靖人担纲大模型研发，技术领导力突出。阶跃星辰的核心团队堪称“梦之队”，创始人姜大昕博士、首席科学家张祥雨、系统负责人朱亦博等均是行业翘楚，公司研发人员占比超过80%。智谱AI依托清华大学的技术底蕴，创始人唐杰、张鹏等在学术界和产业界均有深厚积累。DeepSeek团队则由标志性人物梁文锋领衔。

　　技术实力与前瞻性的战略布局，是“基模五强”得以引领市场的核心驱动力。在模型能力的构建上，它们展现出“全能型选手”与“专精型选手”的不同路径。

　　字节跳动、阿里、阶跃星辰和智谱AI均致力于打造覆盖语言、图像、语音、乃至多模态综合理解与生成的全面模型矩阵，并在各大权威评测中稳居第一梯队。

　　字节跳动凭借其深厚的工程能力和海量数据积累，在模型的通用性与规模化应用潜力上优势显著。阿里巴巴的通义大模型则以“开源王者”的姿态，率先且完整地向业界开放其技术能力，展现了其全面的技术布局。

　　阶跃星辰在短时间内便推出了超过二十款自研基座模型，其中多模态模型占比高达七成以上，被业界誉为“多模态卷王”；其Step系列语言大模型和多模态大模型在LiveBench、LMSYS Org Chatbot Arena等权威榜单上均有亮眼表现。智谱AI则通过GLM系列模型的持续迭代，从GLM-4基座大模型到对标Sora的生成模型CogVideoX，再到免费的多模态模型GLM-4V-Flash，构建了丰富的模型矩阵。

　　与之相对，DeepSeek更像一位“技术奇兵”，专注于在代码生成、数学逻辑推理等特定领域实现极致突破，并通过坚定的开源策略与高效的工程优化，迅速在开发者社区中建立影响力，以单点突破搅动市场格局。

　　“追求智能的上限仍然是当下最重要的一件事。”阶跃星辰CEO姜大昕在近期的发言中反复强调了这一点，直指大模型核心的认知与推理能力。模型的参数规模和数据量固然重要，但能否真正理解复杂指令、进行深度思考、并给出高质量的解决方案，才是衡量其智能水平的关键。

　　正如姜大昕所观察到的，自OpenAI发布o1到DeepSeek R1的惊艳亮相，“推理模型从一个趋势变成了范式，现在语言模型基本上是推理模型一统天下。”

　　在这一方向上，“基模五强”均在持续发力。DeepSeek凭借其在数学、代码等领域的强大推理能力，已经树立了技术标杆。字节跳动和阿里则依托其雄厚的工程实力和数据优势，不断优化模型架构，提升模型的综合认知水平。智谱AI聚焦高性能推理架构，通过轻量化设计和工具调用提升实际应用效率。阶跃星辰以多模态融合为核心，通过姜大昕也在媒体沟通会上表示，模型的突破是先于商业化的。不难看出，对底层智能上限的持续投入是阶跃星辰的核心战略。

　　如果说提升智能上限是让模型“更聪明”，那么多模态能力的构建则是让模型“更全面”，使其能够像人一样通过多种感官理解和交互世界。姜大昕对此有着明确的判断，“多模态是实现AGI的必经之路。”

　　“基模五强”在多模态领域的布局各有侧重，但都展现出高度的战略重视。阶跃星辰无疑是其中的“多模态卷王”，在其发布的22款自研基座模型中，有16款是多模态模型，占比超7成。

　　多模态能力的突破，也直接关系到Agent的成熟与爆发。姜大昕认为，Agent爆发需要两个必要的条件，一个是多模态的能力，另外一个是慢思考的能力，这两个能力恰好在2024年的时候取得了突破性的进展。值得关注的是，阶跃星辰已在智能终端、新零售等场景积极布局，快速进入“Agent时代”。

　　对智能上限的无尽追求和多模态能力的全面构建，已成为大模型下半场竞争的核心赛点。而新“基模五强”凭借各自的优势和战略定力，正在这两大方向上加速快跑。

　　文/辛夷

推荐图文