全球最大开源生成模型国内首发 阶跃星辰上架阿里云魔搭社区
更新时间:2025-02-21 13:47:47 浏览次数:

  在2月21日开幕的全球开发者大会上,阿里云魔搭社区首发阶跃星辰最新开源的两款多模态模型,包括全球参数量最大的开源生成模型Step-Video-T2V,以及业界首款产品级开源语音交互模型Step-Audio。截至目前,魔搭社区已上架超过4万个开源模型,涵盖LLM、对话、语音、文生图、图生等多个领域,是中国最大的AI模型社区。

  此次在魔搭社区开源的两款模型,是近期全球多模态领域最热门的开源模型。Step-Video-T2V是基于300亿参数的文本转预训练模型,能够生成高达204帧的,在指令遵循、运动平滑性、物理合理性、美感度等方面表现均显著超过市面上既有的开源模型。

  另一款上架模型Step-Audio,是业界首个产品级开源语音模型,参数规模多达1300多亿。根据Llama Question等5大主流公开测试,Step-Audio模型性能均位列第一,并在HSK-6的测评中表现尤佳。

推荐图文

鄂ICP备2024040700号-2
武汉砺行体育文化传媒有限公司-版权所有
数据源自网络仅供参考