“接下来,AI的重点将从解决问题转向定义问题。”近日,OpenAI研究员姚顺雨在其新博文中表示,AI下半场的重点将从解决问题转向如何定义有现实意义的任务,如何有效评估AI系统的表现,“要思考‘我们应该训练AI做什么?我们如何衡量真正的进步?’”
当Agent已成大势所趋,字节跳动近期开启了其Agent产品“扣子空间”的内测。哪怕是在邀请制度下,拥有如字节般的算力资源,服务器还是被用户的热情挤爆了,产品邀请码也成为社交平台和二手交易平台上的紧俏“硬通货”。
4月22日,在获得邀请码后,从商业化角度来看,曾经“一码难求”的AI Agent产品“Manus”已在3月末公布了用户收费细则,如今字节跳动、百度等头部“大厂”接连布局,Agent是否会带来一条清晰的变现路径?在“大厂”的生态优势和算力资源面前,创业公司打造Agent产品中的机会何在?
“扣子空间”既做“通用实习生”又做“领域专家”?
“太快了,没了”“求个邀请码”“爆满了”,在“扣子空间”正式开启内测后,小红书、即刻等社交平台上涌现出大批想去体验的用户,该产品的邀请码甚至在闲鱼等二手交易平台上被明码标价交易。
官网显示,“扣子空间”主打生产力全面提升、专家能力深度支持、写作模式灵活调整以及能力边界拓展延伸的优势。官网展示了市场调研报告分析、股票早报定制、生成互动式教学网站以及旅游攻略制作等16个典型应用场景。“在扣子空间里,精通各项技能的‘通用实习生’,各行各业的‘领域专家’,任你选择。”
“Agent可以做的事情更多,很多事情不限于文本交互。”一位头部大模型技术人员在接受在获得邀请码后,
首先在旅游规划上,在提出“今年‘五一’假期,我和父母要去日本东京玩6天,想看富士山,还想吃到当地特色小吃和2家米其林餐厅。请你为我制作一个图文并茂的旅行手册”的需求后,Agent将该任务拆解为信息收集、资料整理与
该网页设计风格简洁优美,但旅游攻略制定得较为笼统,例如在餐厅详细信息以及预约情况等内容上有所缺失。
随后,
但美中不足的是,这些植物以卡片形式呈现,而非提示词中要求的“希望背景是一个大花园,常见植物栽种其中,呈现动态摇摆状态”。对此,一位大模型算法工程师通过向在信息提取任务上,
“大厂”入局,Agent还是创业公司能玩的游戏吗?
“要让AI真正为各行各业带来变革,Agent是必经之路。”在4月17日进行的火山引擎AI创新巡展杭州站会后,火山引擎总裁谭待在接受在他看来,具备能完成专业度较高、耗时较长的完整任务的能力,才能称之为Agent。“能完成打油诗、简单报告等任务的不能称为Agent。”他说:“从技术实现角度来看,如果没有运用思考模型,缺乏反思和规划能力,也很难被认定为Agent。”
一位头部大模型技术人员在接受在Agent的布局过程中,Claude母公司Anthropic推出的MCP成为近期国内外头部厂商的一大关注点。MCP通过统一的协议标准,使Agent能够以一致的方式接入各种本地或远程工具,降低了开发复杂度。
在4月17日的中,谭待表示协议统一很重要。“如果能做到统一协议,大家的应用开发就会更快,模型调用也会更智能。”
“字节跳动拥有、电商、本地生活、移动办公等丰富多元的应用生态体系,它去做Agent就有初创企业根本无法比拟的优势。”快思慢想研究院院长田丰接受既然“大厂”在Agent领域已有自己的先发优势,那么创业公司发力Agent还会有机会吗?
“当然有了。”田丰很笃定。他以近期OpenAI计划以30亿美元收购AI编程初创公司Windsurf为例,“这家公司在编程决策智能上就有很强的差异性,而且做得非常专。所以做专业、做深入,永远会是创业公司的基础”。
工信部信息通信经济专家委员会委员盘和林也通过向与此同时,谈及Agent未来的商业化可能性,田丰认为,现在Agent属于早期发展阶段,字节跳动等“大厂”需要打通更多工具的调用渠道,培养出一个良好的开发者生态,“直到Agent可以解决用户刚需问题,真正提高生产力、让用户有生产提效效益时,用户自然愿意进行付费”。



