技术、方法、软件、行业领导者——自动驾驶的关键组成部分解读

智车科技IV
关注

二、自动驾驶软件

感知:感知模块分析原始传感器数据,输出自动驾驶汽车所处于的环境理解。这个过程类似于人类的视觉认知。感知模块主要包括对象(自由空间、车道、车辆、行人、道路损坏等)检测与跟踪、三维世界重建(利用运动结构、立体视觉等)等。最先进的感知技术可以分为两大类:基于计算机视觉和基于机器学习。前者一般通过显式射影几何模型来解决视觉感知问题,并使用最优化方法寻找最佳解。基于机器学习的技术通过使用数据驱动的分类/回归模型(如卷积神经网络)来学习给定感知问题的最佳解决方案。SegNet和UNet在语义图像分割和对象分类方面取得优秀的成绩。这种神经网络具有极高的易用性,可以很容易地用于其他类似的感知任务,如迁移学习。多传感器信息融合的感知可以产生更好的理解结果。

定位和地图:利用传感器数据和感知输出,本地化映射模块不仅可以估计自动驾驶汽车位置,还可以构建和更新三维世界地图。自从同步定位和地图(SLAM)的概念在1986年引入以来,就得到了业内人士的普遍关注。最先进的SLAM系统通常分为基于过滤器的SLAM和基于优化的SLAM。基于过滤的SLAM系统是由贝叶斯滤波得到的,通常通过增量集成传感器数据,迭代估计自动驾驶汽车姿态并更新三维环境地图。最常用的滤波器有扩展卡尔曼滤波器(EKF)、无迹卡尔曼滤波器(UKF)、信息滤波器(IF)和粒子滤波器(PF)。另一方面,基于优化的SLAM方法首先通过寻找新观测值与地图之间的对应关系来识别问题约束。然后,计算和改进自动驾驶汽车的姿势,并更新3D地图。基于优化的SLAM方法可以分为两个主要分支:Bundle Adjustment (BA)和graph SLAM。前者利用高斯-牛顿法、梯度下降等优化技术,通过最小化误差函数,联合优化三维地图和摄像头姿态。后者将定位问题建模为一个图形表示问题,并通过寻找不同车辆姿态的误差函数来求解。

预测:预测模块分析其他交通代理的运动模式,预测自动驾驶汽车未来的运动轨迹,使自动驾驶汽车能够做出合适的导航决策。目前的预测方法主要分为两大类:基于模型的预测方法和基于数据驱动的预测方法。前者根据基本的物理系统运动学和动力学,通过传播其运动状态(位置、速度和加速度)来计算自动驾驶汽车未来的运动。例如,奔驰的运动预测组件使用地图信息作为约束来计算自动驾驶汽车的下一个位置。卡尔曼滤波在短期预测方面表现良好,但在长期预测方面表现不佳,因为它忽略了周围的环境,比如道路和交通规则。在此基础上,建立了基于引力和斥力的行人运动预测模型。近年来,随着人工智能和高性能计算的发展,许多数据处理技术,如隐马尔可夫模型(HMM)、贝叶斯网络(BNs)和高斯过程(GP)回归,用来预测自动驾驶汽车状态。近年来,研究人员利用逆强化学习(IRL)对环境进行建模,比如,采用逆最优控制方法对行人路径进行预测。

规划:规划模块根据感知、定位、映射以及预测信息确定可能的安全自动驾驶汽车导航路径。规划任务主要分为路径规划、机动规划和轨迹规划。路径是自动驾驶汽车应该遵循的几何路径点列表,以便在不与障碍物碰撞的情况下到达目的地。最常用的路径规划技术有:Dijkstra、动态规划、A*、状态格等。机动规划是一个高层次的自动驾驶汽车运动表征过程,因为它同时考虑了交通规则和其他自动驾驶汽车状态。在找到最佳路径和机动规划后,必须生成满足运动模型和状态约束的轨迹,这样才能保证交通的安全性和舒适性。

控制:控制模块根据预测的轨迹和估计的车辆状态向油门、刹车或转向扭矩发送适当的命令。控制模块使汽车尽可能接近计划的轨迹。控制器参数可以通过最小化理想状态和观测状态之间的误差函数(偏差)来估计。比例积分导数(PID)控制、线性二次调节器(LQR)控制和模型预测控制(MPC)是最常用的最小化误差函数的方法。PID控制器是一种利用比例项、积分项和导数项使误差函数最小的控制回路反馈机构。当系统动力学用一组线性微分方程表示,成本用二次函数表示时,利用LQR控制器使误差函数最小化。MPC是一种基于动态过程模型的先进过程控制技术。这三种控制器各有优缺点。自动驾驶汽车控制模块一般采用上述方法的混合模式。例如,初级自动驾驶汽车使用MPC和PID来完成一些低级反馈控制任务,例如应用变矩器来实现所需的车轮转角。百度Apollo采用了这三种控制器的混合的模式:PID用于前馈控制、LQR控制轮角、MPC对PID和LQR控制器参数进行优化。

三、开源数据集

在过去的十年中,已经公布了很多开源数据集,这为自动驾驶研究做出了巨大贡献。小编搜集了几种使用最多的数据集,并简要说明各种数据集的用途。Cityscapes包含一个大规模的数据集,可以用于像素级和实例级的语义图像分割。ApolloScape可用于各种自动驾驶汽车感知任务,如场景解析、汽车实例理解、车道分割、自定位、轨迹估计以及目标检测和跟踪。此外,KITTI提供了用于立体和流量估计、目标检测和跟踪、道路分割、里程估计和语义图像分割的可视化数据集。6D-vision使用立体摄像机感知三维环境,提供立体、光流和语义图像分割的数据集。

四、行业领导者

最近,投资者开始把钱投向自动驾驶系统商业化竞赛潜力股。自2016年以来,特斯拉的估值一直在飙升。这使得承销商推测,该公司将在几年内产生一支自动驾驶车队。此外,自2017年报道通用汽车计划制造无人驾驶汽车以来,该公司股价已经上涨了20%。截止2018年7月,Waymo已经在美国对其自动驾驶汽车进行了800万英里的测试。在2018年度,通用汽车和Waymo事故最少:通用汽车在212公里以上发生了22次碰撞,而Waymo在563公里以上只发生了3次碰撞。除了行业巨头,世界一流大学也加快了自主驾驶的发展。这些大学都很好地开展了产学研相结合的模式。这使高校更好地为企业、经济和社会做出贡献。

应用场景:自动驾驶技术可以应用于任何类型的车辆,如出租车、长途汽车、旅游巴士、货车等。这些交通工具不仅可以使人们从劳动密集型和单调乏味的工作中解脱出来,而且可以确保他们的安全。例如,配备自动驾驶技术的道路质量评估车辆可以修复检测到的道路损伤。此外,使用自动驾驶技术,道路参与者可以相互沟通,公共交通将更加高效和安全。

五、现存挑战

尽管自动驾驶技术在过去的十年中发展迅速,但仍然存在许多挑战。例如,感知模块在恶劣的天气和/或光照条件下或在复杂的城市环境中表现不佳。此外,大多数感知方法通常是计算密集型的,不能在嵌入式和资源有限的硬件上实时运行。此外,由于长期不稳定性,目前SLAM方法在大规模实验中的应用仍然有限。另一个重要的问题是如何融合自动驾驶汽车传感器数据,以快速、经济的方式创建更准确的三维语义词。此外,人们何时才能真正接受自动驾驶和自动驾驶汽车,仍然是一个值得讨论话题,由此也引发了严重的伦理问题的探讨。

参考文献:

[1] J. Jiao, Y. Yu, Q. Liao, H. Ye, and M. Liu, “Automatic calibration of multiple 3d lidars in urban environments,” arXiv preprint arXiv:1905.04912, 2019.

[2] H. Ye, Y. Chen, and M. Liu, “Tightly coupled 3d lidar inertial odometry and mapping,” in 2019 IEEE International Conference on Robotics and Automation (ICRA). IEEE, 2019.

[3] R. Fan, M. J. Bocus, Y. Zhu, J. Jiao, L. Wang, F. Ma, S. Cheng, and M. Liu, “Road crack detection using deep convolutional neural network and adaptive thresholding,” arXiv preprint arXiv:1904.08582, 2019.

[4] C. Coberly, “Waymo’s self-driving car fleet has racked up 8 million miles in total driving distance on public roads,” https://www.techspot.com/news/75608-waymo-self-driving-car-fleetracks-up-8.html, accessed: 2019-04-21.

[5] D. Welch and E. Behrmann, “Who’s winning the self-driving car race?” https://www.bloomberg.com/news/features/2018-05-07/whos-winning-the-self-driving-car-race, accessed: 2019-04-21.

声明: 本文由入驻OFweek维科号的作者撰写,观点仅代表作者本人,不代表OFweek立场。如有侵权或其他问题,请联系举报。
侵权投诉

下载OFweek,一手掌握高科技全行业资讯

还不是OFweek会员,马上注册
打开app,查看更多精彩资讯 >
  • 长按识别二维码
  • 进入OFweek阅读全文
长按图片进行保存