8月25日,航锦科技在互动平台表示,公司也关注到近期deepseek最新发布模型v3.1,采用针对下一代国产芯片涉及的UE8M0 FP8 Scale参数精度的新闻。目前,公司航锦云在上海管理运营的云服务项目L20灯塔集群实践了FP8精度的训练和推理,利用E5M2/E4M3格式,可将数学吞吐量翻倍,并将带宽压力减少一半。其中,FP8训练在相同加速平台的峰值性能显著超越FP16/BF16,且模型参数越大,训练加速效果越好。