ECCV 2020 | 基于对抗路径采样的反事实视觉语言导航

将门创投
关注

为了提升对于未知环境的适应性,预探索也被应用到了整套系统中去。导航器可以首先探索不熟悉的环境,并增加在未知环境中执行导航指令的机会。针对先前的预探索方法,像束搜索和自模仿学习,他们基于指令并对每一条指令进行优化,但这种方法会造成路径过长。在真实环境中部署机器人到陌生环境时,首先要熟悉环境并有效地在环境中执行自然语言指令。

与先前方法优化给定指令或假设一次性覆盖所有未知环境不同,本文提出了利用APS方法来实现基于环境的预探索,可以使得智能体仅仅针对同一环境中的任务进行环境预探索,而无需先验知识。在未知环境中,利用APS来采样多条路径P’并生成导航指令I’。随后利用(P’,I’)来优化位置环境中的NAV。在预探索过程中,固定APS参数而仅仅优化NAV。通过这样的方法可以有效提升模型对于未知环境的适应能力。

未知环境中的预探索优化流程。APS对未知环境进行采样来优化NAV。

二、实验结果

为了验证这种方法的有效性,研究人员在视觉语言导航数据集R2R(Room-to-Room)上进行了实验。实验分别针对Seq2Seq、Speaker-Follower、RCM等三个基准进行,分别为其增加随机采样增强路径、APS采样增强路径观察导航误差(Navigation Error)、成功率(Oracle Success Rate,Success Rate)、路径长度加权的成功率(Success Rate weighted by Path Length),其结果如下表所示:

可以看到基于APS的方法显著地提升了三种基准的性能,下图还更为直观地反映了随机采样和APS增强采样模式针对两种方法在不同增强率下性能提升:

下图还展示了预探索策略对于未知环境导航的有效性,可以看到经过预探索后导航模型可以根据指令径直向前,方向和移动过程更为准确。研究人员还发现在差异较大的环境中,预探索能显示出的能力也就越强,在实际使用中就会具有更强的适应性和泛化性。

如果想要了解更多的实现细节和实验结果分析比较,请参看论文,其中不仅包含了充分的理论分析和模型的详尽实现细节,同时还涵盖了完整的消融性分析结果。

关于我“门”

将门是一家以专注于发掘、加速及投资技术驱动型创业公司的新型创投机构,旗下涵盖将门创新服务、将门技术社群以及将门创投基金。将门成立于2015年底,创始团队由微软创投在中国的创始团队原班人马构建而成,曾为微软优选和深度孵化了126家创新的技术型创业公司。

将门创新服务专注于使创新的技术落地于真正的应用场景,激活和实现全新的商业价值,服务于行业领先企业和技术创新型创业公司。

将门技术社群专注于帮助技术创新型的创业公司提供来自产、学、研、创领域的核心技术专家的技术分享和学习内容,使创新成为持续的核心竞争力。

将门创投基金专注于投资通过技术创新激活商业场景,实现商业价值的初创企业,关注技术领域包括机器智能、物联网、自然人机交互、企业计算。在近四年的时间里,将门创投基金已经投资了包括量化派、码隆科技、禾赛科技、宽拓科技、杉数科技、迪英加科技等数十家具有高成长潜力的技术型创业公司。

声明: 本文由入驻OFweek维科号的作者撰写,观点仅代表作者本人,不代表OFweek立场。如有侵权或其他问题,请联系举报。
侵权投诉

下载OFweek,一手掌握高科技全行业资讯

还不是OFweek会员,马上注册
打开app,查看更多精彩资讯 >
  • 长按识别二维码
  • 进入OFweek阅读全文
长按图片进行保存