ResNet18 作为 backbone 的时候速度最快,精度已经超过大多数甚至某些双目方法,但仍弱于 M3D-RPN(目前不利用其它训练数据最好的网络),当采用 DLA-34 时速度仍然比别的方法快,而且精度超过 M3D-RPN。
消融实验
对维度、方向、距离和关键点偏移四个可选项进行了消融实验,四个可选项全部使用时得到了最高的准确率。
分析了关键点FPN的作用,
同时发现 3D 反向投影的 2D 结果要优于直接对 2D 进行预测。
结论
本文提出了一种用于自动驾驶场景的单眼 3D 目标检测方法。将 3D 检测作为关键点检测问题,并展示了如何通过使用关键点和几何约束来恢复 3D 边界框。本文提出的用于 3D 检测的点检测网络,可以仅使用图像输出 3D 框的关键点和对象的其他先验信息生成稳定且准确的 3D 边界框,而无需包含独立网络和增加额外标注数据,同时可实现实时运行速度。