AI模型总是会遇到模棱两可的情况,因此他们很难仅凭指令做出响应。这对于负责例如导航公寓的自治代理来说是个问题,因为当它们呈现多条路径时,它们冒着被卡住的风险。
12月5日消息,亚马逊Alexa AI部门的研究人员开发了一个框架,使代理商能够在某些情况下寻求帮助。代理商使用所谓的基于模型混淆的方法,根据预先定义的置信度阈值所确定的混淆程度来提出问题,研究人员声称,该阈值可将代理商的成功率提高至少15%。
该团队在研究报告中写道:“考虑到您希望机器人助手将钱包放到床上的情况……场景中有两扇门,并且一条指令只告诉它要走过门口。” “在这种情况下,机器人显然很难准确知道要从哪个门进入。但是,如果机器人能够与用户讨论情况,则可以解决情况的歧义。”
该团队的框架采用了两个代理模型:“模型混淆”(Model Confusion),它模仿人类用户在混乱状态下的行为;以及“动作空间增强”(Action Space Augmentation),一种更复杂的算法,可以自动学习在导航过程中的正确时间仅询问必要的问题。人机交互数据用于进一步微调第二个模型,以使其熟悉环境。
每当代理人(在本研究中是在模拟房屋中导航的机器人)在导航过程中迷路时,它会向用户发出“我迷路,请帮助我!”信号并寻求帮助。当用户提供对机器人后续问题的答案时,“动作空间增强”将纠正最初错误的轨迹,并使用反馈来防止将来发生同类错误。
研究人员汇编了一个数据集,其中包含21,567条导航指令(其中14025条用于训练; 1,020条用于在可见环境中进行验证; 2,349条在未见环境中进行验证),其中的指令词汇由大约3,100个单词组成。他们对机器人的成功率和所采取的步骤数进行了评估,其中“成功”构成了小于3米的导航误差。
研究小组报告说,该机器人设法动态调整以适应不清楚和错误的人类反应,并且与以前提出的机器人自行探索环境的提议的探索技术相比,他们提出的策略“实质上”具有更高的数据效率。他们写道:“我们是第一个在基于指令的导航任务中引入人机交互的人。” “ [这种]数据增强方法……在持续学习的场景中很有用,因为[代理]可以在客户家里不断提高其性能。”
这项工作可能会为亚马逊长期以来传闻中的家用机器人提供信息,彭博社在去年的一份报告中将其描述为类似于Echo Show的机器人,尽管它带有轮子。代号为Vesta的是罗马炉灶女神,据说包装了远场麦克风和扬声器,使它们能够理解和响应Alexa识别的数千个命令,并能够使用计算机视觉和技术在房屋中导航例如同步定位和地图绘制。
亚马逊正在波士顿扩张,新的4000万美元的办公室巩固了该地区作为科技巨头的机器人创新中心的地位。
新址位于马萨诸塞州韦斯特伯勒市郊区,占地35万平方英尺,位于波士顿以西约35英里处,拥有公司办公室、研发实验室和制造业空间新的设施,在2021开放,200人的房间,将补充亚马逊现有的机器人办公室在北阅读,Mass。
“我们很高兴能在马萨诸塞州发展我们的团队,并利用MetroWest提供的人才和区域连通性,”亚马逊机器人首席技术师Tye Brady说“这将是一个世界级的设施,我们的团队可以在同一个屋檐下设计、建造、编程和运送我们的机器人这种扩张将使我们能够继续快速创新,提高全球客户的交付速度。”
亚马逊表示,自2011年以来,该公司在马萨诸塞州创造了4000多个就业岗位,在该州的投资超过30亿美元波士顿是亚马逊北美第二总部20个入围者之一如今,该公司在该地区有475个空缺职位。
波士顿在2012年以7.75亿美元收购Kiva Systems后成为亚马逊的机器人中心这家初创企业专注于实现中心的自动化技术——更为人所知的仓库机器人。
1、本文由入驻智造人才网资讯专栏的作者撰写或者网上转载,观点仅代表作者本人,不代表智造人才网立场。如有侵权或者其他问题,请联系举报。
2、本网转载并注明自其它来源的作品,目的在于传递更多信息,并不代表本网赞同其观点或证实其内容的真实性,不承担此类作品侵权行为的直接责任及连带责任。其他媒体、网站或个人从本网转载时,必须保留本网注明的作品来源,并自负版权等法律责任。
3、如涉及作品内容、版权等问题,请在作品发布之日起一周内与本网联系,否则视为放弃相关权利。
Copyright C 2021 All Rights Reserved 版权所有 智造人才网 粤ICP备2022085165号 公安备案号44190002004849
地址:东莞市横沥镇新城工业区兴业路121号 EMAIL:qiufukang2007@163.com
Powered by 广东智造