国内AI交互赛道再添重磅玩家。
近日,字节跳动旗下AI智能助手“豆包”的App上线通话功能,支持聊天问答。据官方介绍,本次升级基于5月27日,一位大模型算法工程师接受继文生大模型后,字节在AI多模态领域又迈出关键一步。
豆包App上线了实时通话功能,这一功能的实现正是基于豆包为了更直观地展示这一新功能的应用场景,豆包团队在其官方和豆包打个电话,是否真的能解决上述这些生活问题呢?百闻不如一见,首先,是较为基础的挑选水果任务,这也是用户在小红书等社交媒体上分享得最多的应用场景。“你来帮我挑选一个木瓜吧。”当开启通话后,豆包通过对果实表皮颜色、饱满程度等指标的观察,快速给出了挑选建议。有小红书用户在使用豆包挑选蔬菜后表示:“感觉突然身边多了个懂行的买菜老大爷。”
在识别物品和推荐书籍的环节,豆包展现出了良好的记忆能力和连贯的实时、互动性能。例如,面对杂乱摆放着书籍、巧克力、耳机和电子时钟等物品的书桌,豆包可以轻松识别所有物品的详细信息并记忆它们在桌上的摆放位置。
这一记忆功能在“大概率是每隔几秒给模型拍摄一张。”一位大模型算法工程师在上接受与豆包进行关于多本书籍的聊天时,豆包能够结合记忆能力与实时,对书籍内容、知名经济学者、工信部信息通信经济专家委员会委员盘和林在接受他认为,豆包在商业拓展时主要还是和“剪映”集成,可以和抖音的内容审核AI结合。比如可以通过AI发现违规的短内容。盘和林还表示,AI交互的使用前景非常光明,比如生成虚拟人进行直播,又比如通过AI识别来迅速对文件进行归纳总结。
另一方面,AI眼镜这一类符合通话应用场景的新硬件逐渐升温,也给AI交互带来了更多可能性。
盘和林认为:“AI交互可以和AI眼镜有限结合,但现阶段AI眼镜的算力和显示等方面还存在技术缺陷。所以,期待未来有新的融合。”