DeepSeek上线以来,国产算力资源的采购意愿显著提升。
3月24日,当算力资源的灵活调度成为新趋势,国产算力芯片的全面普及还面临哪些挑战?
但不可否认的是,这场由技术驱动、政策支持、市场需求共同推动的算力革命,正在悄悄改变国产算力的命运,芯片厂商迎来了从技术适配迈向商业落地的关键阶段。
星期一,在中国电信上海分公司的天翼云能力运营中心,不时有企业咨询不同芯片算力卡的服务费用。
放下电话,解决方案中心经理宋蒙向自2022年起,从A100、H100到“降级版”A800、H800,美国限制高端AI芯片对华出口背后的底层逻辑是基于AI训练“大力出奇迹”的认知,即认为更大的AI模型、更多算力资源就意味着更智能的AI。然而,这一认知似乎正在被新的算法范式打破。
今年1月,DeepSeek通过Transformer架构优化、混合精度训练、计算并行优化以及分布式存储管理等技术创新,大幅降低AI训练和推理的计算需求。小而美且开源的DeepSeek,不仅让全球反思“堆卡烧钱”的OpenAI路线是否走偏,也为国产算力芯片和云服务商打开通往AGI的另一扇窗。
在宋蒙看来,中国AI应用落地受限于两大瓶颈。首先,英伟达构建的CUDA生态护城河,让AI大模型向国产算力芯片的迁移变得困难;其次,在国产大模型百花齐放、国产芯片厂商不断涌现的背景下,多对多的算法和算力适配更是困难重重。
“但DeepSeek很好地解决了第二个问题。”宋蒙告诉此外,三大运营商全面接入DeepSeek后,其GPU利用率及IDC上架率也有所提升。电信天翼云自主研发的“息壤”智算平台,也在今年2月完成了国产算力芯片与DeepSeek-R1/V3系列大模型的深度适配优化。
谈及DeepSeek带来的业务变化,3月25日,中国电信董事长兼首席执行官柯瑞文在2024年度业绩说明会上表示,息壤DeepSeek一体机推出后签约额已达6亿元,从内部资源使用来看,自有算力售卖率已超过90%,相比DeepSeek上线前翻倍。
此外,中国电信天翼云官网访问量也在两周内增加了5.7万人次,为DeepSeek上线倍。与此同时,模型服务和token调用量都呈现出了指数级的增长。
火爆的需求背后是企业对部署方式的多样化选择。宋蒙告诉为了避免数据泄露,一些企业开始采取本地化部署。“他们会在自己的机房单独购买GPU服务器,将开源大模型DeepSeek装在服务器上,连到企业自己的内网就可以使用了。这种方式保证了数据安全,但最大的问题就是太贵了。”宋蒙坦言。
宋蒙告诉于是,为满足数据安全、成本节约的需求,“公共算力服务平台”应运而生。上海电信将其形象地称为“算力超市”,企业可以通过产品订购,享受到运营商级的机房环境、独立的硬件资源以及专属的DeepSeek模型。
蚂蚁集团Ling团队发表论文称,实验表明,MoE大模型可在国产芯片上训练出与英伟达H800芯片相当的效果,且训练成本降低20%。
中国正在经历一场低调的算力革命,这无疑点燃了“去英伟达化”的希望。从华为910B撑起千亿参数模型训练,到DeepSeek带动国产芯片厂商完成软硬件协同适配,国产算力正试图通过算法创新与硬件迭代实现弯道超车。
随着国产芯片借势崛起,未来,普惠型“算力超市”又该如何保证优质算力资源上架,降低硬件迭代的采购风险?3月24日,
实探智算中心:国产GPU测试基本完成
来到园区,一栋栋5层高的数据机楼正在加紧建设。走进临港智算谷,现场物业部经理向“随着DeepSeek的火爆出圈,我们针对本地化部署需求推出了标准化、模块化、定制化的算力基础服务。”临港算力项目部项目经理时云松告诉目前,已有企业对建设中的数据机楼订购了包楼服务。对此,项目部需要在园区建设上进行超前考量,结合客户对机楼层高以及实际荷载要求,以“两弹一优”的高标准提高供电、散热、制冷、承重等基础设施能力,从而实现快速响应和定制化的基础服务。
行至数据机楼3层,时云松称,临港智算中心的国产万卡算力池,使用的算力卡主要集中在华为910B,另有壁仞、沐曦等国产算力卡也已基本完成性能测试,目前应用于国产混训项目中。
宋蒙补充道,目前,国产算力厂商不断推出新型GPU芯片,如果能够以更低的成本给客户使用,公司也愿意引入此类产品,但需经过国产GPU创新联合基地的测评,只有性能符合要求、价格为市场所接受的算力资源才会最终上架。
“长久运营好算力超市,要做好质量与服务两件事。”在谈及未来的长期规划时,宋蒙认为,向客户提供高质量的算力服务,不仅体现在拥有琳琅满目的算力产品,还要提供满足客户需求的使用服务,围绕客户的真实使用场景,推出模型调优、AI应用等进阶服务。
宋蒙观察发现,如今越来越多的客户不仅需要算力和模型,更想要能直接上手的AI应用。中国电信正准备上架一系列AI应用,涉及专属智能问答、AI企业法务、智能公文写作等细分领域。