飞机器人首席科学家、聆动通用CEO季超看来,全自主并非新命题,传统自动化已经实现特定场景的全自主。他对因此,他认为,定义全自主的关键要素,首先要有动作流,一个个动作基于时间序列串成一个连续动作;在这个过程中这些动作可以完成一些任务,这就是任务流;要实现完全自主,就要把机器人跟真实的生产生活结合起来,这就是业务流。“如果是做B端方向,机器人一定是有业务流的。业务流、任务流和动作流能够实现全流程闭环,它就可以完成一个自主化的运行。”
季超强调,实现自动化的必要条件是要跟业务场景结合,形成因果驱动的任务链。如果机器人没有场景、没有业务,比如只是希望它往前走一走,往后走一走,但是并没有因果关系,这其实更多的还是基础动作流的展示。
加速进化公司一直在聚焦机器人足球赛。公司国际化负责人李超逸对谈及投入大量资源聚焦机器人足球赛的原因,他说,比赛能够在短时间内高密度地锤炼机器人的感知、定位、导航、避障、稳定行走及倒地恢复等能力。这些能力未来都可以迁移至家庭、工业等真实场景。
自主换电机器人
模型和数据制约具身智能扩展至更通用场景
季超提到,随着大语言模型、多模态大模型及具身大模型的发展,机器人已经具备任务理解与动作规划、动作执行能力。
但是,多位受访者提到,模型和数据制约了具身智能扩展至更通用场景。
赵哲伦提到,现在的难点在于,如果是机械臂相关的操作类物理AI,执行的成功率可能没那么高,效率相对也会比较低。“这涉及具身智能研发范式问题,即它确实没有非常充分的数据,使其在某一个场景下或在通用场景下做得特别好。”
他进一步解释,比如目前以智能驾驶为基础的类似VLA的模型,其实泛化性比较差,因为没有物理环境的数据。就像机器人叠被子,能叠花被子,但可能叠不了蓝被子。“大家对机器人的预期是它能叠所有的被子,但事实上它从感知到理解还是有差距的。”
“当然,物理AI在定义上是清晰的,就是要自主。”赵哲伦说,但是也要看到,所有物理AI都必须经历从有限场景到无限场景的扩展,就像自动驾驶从单车道到高速公路,再到城市场景的演进。
而在模型方面,松延动力CFO韩深任对他认为,目前制约模型成熟的因素主要是大家对模型的认知没有形成统一范式,或者说现在的架构不清晰,VLA等主流架构能否最终胜出仍不确定。
在韩深任看来,将模型跟数据的逻辑跑通,可能需要3~5年,届时机器人才能像真人一样决策,遇到问题会自行处理,这样才能走进千家万户。
完全自主的人形机器人何时能够实现?谭旻认为,如果要达到与人类同等水平的完全自主,行业共识认为仍需数十年,有限自主有望在2030年至2050年实现。届时,机器人可在特定场景下理解自然语言指令并完成任务,例如“从冰箱拿一瓶可乐”。但复杂、泛化的家庭服务仍需长期迭代。
北京长木谷医疗科技股份有限公司的骨科智能手术机器人目前处于“人机协作”阶段,公司董事长张逸凌对均由