“吼你牌”系统让机器人洗盘子更干净

来源:澎湃新闻      时间:2024-04-10    

继家务机器人火爆全网后,近日,斯坦福大学研发Mobile Aloha团队又出新作——一款名为“Yell At Your Robot”(简称YAY Robot)的系统。有了这个系统,可以通过“喊话”来训练机器人。

利用YAY技术调教训练后,机器人在完成每个阶段的成功率都有显著提高。

目前,YAY Robot系统作为研究成果,已经在社交平台上公开,系统也已开源。

通过喊话训练机器人

根据论文介绍,YAY Robot系统是一个通过自然语言反馈,来改善机器人后期训练的系统。在传统方法训练机器人的过程中,研究人员需要观看机器人视频,并且要为每个技能片段、事后动作,进行重新标注或一次性纠正,过程非常费力费时。

为了简化这一过程,YAY Robot研发团队采用了一种更有效的数据收集方法:现场解说。通过在机器人附近放置麦克风,操作人员可以先用语言说出机器人需要掌握的技能,然后遥控机器人进行同步操作,录制的音频可以与机器人的轨迹同步。

经过训练后的YAY Robot可以在与用户的互动中不断改进,提升动作水平,即时调整策略,将语言更有机地融入机器人的学习过程中。研究人员表示,利用YAY技术调教训练后,机器人在完成每个阶段的成功率都有显著提高。比如,在“准备混合食物”这一任务中,经过喊话训练的机器人动作准确性提高了30%-45%、在“清洗盘子”任务中提高了15%-25%。尤其是在清洗盘子这项任务中,研究人员可以直观地看到整个盘子表面的清洁效果,通过人类的口头反馈经过微调之后的机器人清洁力度更强,范围也变大了。

通过人类的口头反馈经过微调之后的机器人清洁力度更强

YAY Robot还引入了实时语言纠正机制

YAY Robot系统是怎么做到的呢?

研发人员透露,整个YAY系统在架构上主要由高级策略和低级策略两个部分组成。其中高级策略负责通过自然语言指令控制低级策略,低级策略则用于执行具体动作。

YAYRobot系统工作机制

此外,YAY系统引入了实时的语言纠正机制。当机器人的操作行为不理想时,操作人员会对YAY Robot系统说,“我想让机器人稍微调整一下”,这些修正语言就会被记录包含在未来的训练数据收集中。

研究人员表明,YAY Robot的目标是通过不断学习,最大可能的减少修正的需要,并随着时间的推移,能与用户的偏好保持一致。

为了提高机器人操作任务的性能,研究人员透露,YAY Robot系统每次要进行 20 次试验,还对子任务的成功率进行测量。“我们的代码实现了采集数据与处理这一过程的自动化,并且已经开源。”研究人员在论文中称。

研究人员施露西在论文中展望,希望未来的研究能进一步让机器人在人类的监督下不断进步,最终让任何人都能帮助教育机器人。

YAY Robot研究成果第一作者施露西本科毕业于大学计算机科学专业,曾在英伟达研究院与朱玉珂教授和 Jim Fan 博士合作,2023年3月加入斯坦福大学切尔西·费恩(Chelsea Finn)实验室,同年8月受邀在谷歌DeepMind就AWE发表演讲。

全部评论


登陆后方可参与评论