CVPR2020 | 基于点的3D单阶段对象检测器3DSSD

学术头条
关注

论文模型

融合采样

3D 目标检测有基于点和基于体素两种框架,前者更加耗时,由候选生成与预测细化两个阶段组成。

在第一个阶段,SA 用于降采样以获得更高的效率以及扩大感受野,FP 用来为降采样过程中丢掉的点传播特征。在第二阶段,一个优化模块最优化 RPN 的结果以获得更准确的预测。SA 对于提取点的特征是必需的。但 FP 和优化模块会限制效率。

首先最容易想到的是直接用 SA 的采样点进行预测,但如果用 D-FPS 的采样方法会使得采样点中有很多背景点,这是由于 D-FPS 是在欧式空间中进行最远点采样,并不会考虑到该点的任何属性特征,从而极大的降低预测效果。

因此本文引入了 F-FPS,以达到保留更多前景点信息的目的,同时为了防止保留很多同一个目标的点导致精度下降,作者将 F-FPS 与 D-FPS 相结合,同时考虑欧式空间和特征空间的采样信息,通过 F-FPS 和 D-FPS 各选择一半的点的方法以保证分类的效果。

边框预测网络

已有的工作是在得到每个点的特征后接三层 SA 分别用于中心点选择、周围点特征的提取以及生成语义信息。本文为进一步降低计算成本,候选中心点的生成是直接在 F-FPS 采样后进行的。F-FPS 采样的点由于比 D-FPS 的点更加可能是前景点,所以候选点仅仅只是在 F-FPS 的点上生成。接着作者将这些候选中心点当作候选生成层的中心点。最后根据候选中心点领域选择从 F-FPS 和 D-FPS 中采样得到的代表点进行局部特征提取,采用 MLP 进行特征提取。

在 3D 目标检测中,需要在场景中每隔一段距离就设置一个锚,这些锚有几个不同的朝向,所以每增加一个类别需要线性的增加锚,为了降低计算量,本文的回归头是无锚的。由于没有每个点的先验方位,在方位角回归中采用分类和回归公式的混合表达式。

在训练过程中,需要一种分配策略来为每个候选点打标签。在 2D 但阶段检测中,IoU 阈值或 mask 可以用于标签分配。在 3DLIDAR 数据上,由于点云数据都在物体的表面,因此他们的中心性非常接近的,这会导致不太可能从这些点得到好的预测。因此之前生成候选点的时候要选取采样后再朝中心靠近的点而不是直接用原始采样点。

声明: 本文由入驻OFweek维科号的作者撰写,观点仅代表作者本人,不代表OFweek立场。如有侵权或其他问题,请联系举报。
侵权投诉

下载OFweek,一手掌握高科技全行业资讯

还不是OFweek会员,马上注册
打开app,查看更多精彩资讯 >
  • 长按识别二维码
  • 进入OFweek阅读全文
长按图片进行保存