德国蒂宾根大学马克斯·普朗克智能系统研究所计算机科学系 Andreas Geiger 教授在CVPR 2020自动驾驶分论坛中,作了题为“构建健壮的驾驶决策”报告。
视频中介绍了两种有关通过学习强大驾驶策略的最新研究结果,这些策略能使CARLA仿真器具有最先进的性能。
为了概括各种条件,通常我们利用多种类型的特定于情境的推理和学习策略。受此观察结果的启发,该团队首先提出了一个新的框架,以学习一种情境驾驶策略,可以有效地捕捉各种情况下的推理,并在CARLA驾驶基准和最先进的性能方面达到98%的成功率。
视频的第二部分讨论了模仿学习中的协变量偏移问题。解决该问题,大多数用数据聚合技术的综合性能都较差,Andreas教授团队提出了一种在经验上具有更好的泛化性能的新颖方法。关键思想是根据收集到的策略数据提供给所对应的学习策略使用,对关键状态进行采样,并合并一个重放缓冲区,该缓冲区逐渐集中于策略状态分布的高不确定性区域。
该方法在CARLA NoCrash基准上进行了评估,重点关注行人和车辆密集的最具挑战性的驾驶场景,实现了87%的专家性能,同时还无需使用任何其他方式就将碰撞率降低了一个数量级。
Andreas教授的研究得出了很多有意义的结论:模仿型学习算法无法捕捉到驾驶的复杂性,数据增强很重要,但在自动驾驶中很容易过度使用,需要更好的专家并且需要改进模拟系统的天气场景,让驾驶策略更完善。。