CVPR2020 | 夜间检测挑战赛两冠一亚，为自动驾驶保驾护航

当然这也带来了模型参数大小和训练时间的增加，属于 speed–accuracy trade－off。该团队也尝试过其他的改进方式，但最终还是选择了实用性更强的 CBNet，该方法不用再额外担心预训练权重的问题。

该团队选择了性价比较高的双 backbone 模型结构。

3．数据增强

该团队发现 Pixel－level 的增强方式导致了性能结果大幅下降，因此没有在这个方向继续尝试。

而图像增强方式 Retinex，从视觉上看带来了图像增强，但是该方法可能破坏了原有图片的结构信息，导致最终结果没有提升。

于是，该团队最终选择了 Spatial－level 的增强方式，使得结果有一定的提升。

实验细节

1．将 Cascade rcnn ＋ DCN ＋ FPN 作为 baseline；

2．将原有 head 改为 Double head；

3．将 CBNet 作为 backbone；

4．使用 cascade rcnn COCO－Pretrained weight；

5．数据增强；

6．多尺度训练＋ Testing tricks。

实验结果

下图展示了该团队使用的方法在本地验证集上的结果：

该团队将今年的成绩与去年 ICCV 2019 同赛道冠军算法进行对比，发现在不使用额外数据集的情况下，去年单模型在 9 个尺度的融合下达到 11．06，而该团队的算法在只用 2 个尺度的情况下就可以达到 10．49。

未来工作

该团队虽然获得了不错的成绩，但也基于已有的经验提出了一些未来工作方向：

1．由于数据的特殊性，该团队尝试使用一些增强方式来提高图片质量、亮度等属性，使图片中的行人更易于检测。但结果证明这些增强方式可能破坏原有图片结构，效果反而降低。该团队相信会有更好的夜间图像处理办法，只是还需要更多研究和探索。

2．在允许使用之前帧信息的赛道二中，该团队仅使用了一些简单的 IoU 信息。由于收集这个数据集的摄像头一直在移动，该团队之前在类似的数据集上使用过一些 SOTA 的方法，却没有取得好的效果。他们认为之后可以在如何利用时序帧信息方面进行深入的探索。

3．该领域存在大量白天行人检测的数据集，因此该团队认为之后可以尝试 Domain Adaption 方向的方法，以充分利用行人数据集。

参考文献：

［1］ Lin T Y ， Dollár， Piotr， Girshick R ， et al． Feature Pyramid Networks for Object Detection［J］． 2016．

［2］ Dai J， Qi H， Xiong Y， et al． Deformable Convolutional Networks［J］． 2017．

［3］ Cai Z ， Vasconcelos N ． Cascade R－CNN： Delving into High Quality Object Detection［J］． 2017．

［4］ Xie S ， Girshick R ， Dollar P ， et al． Aggregated Residual Transformations for Deep Neural Networks［C］／／ 2017 IEEE Conference on Computer Vision and Pattern Recognition （CVPR）． IEEE Computer Society， 2017．

［5］ Bochinski E ， Eiselein V ， Sikora T ． High－Speed tracking－by－detection without using image information［C］／／ 2017 14th IEEE International Conference on Advanced Video and Signal Based Surveillance （AVSS）． IEEE， 2017．

［6］ Henriques J F ， Caseiro R ， Martins P ， et al． High－Speed Tracking with Kernelized Correlation Filters［J］． IEEE Transactions on Pattern Analysis and Machine Intelligence， 2015， 37（3）：583－596．

［7］ Song G ， Liu Y ， Wang X ． Revisiting the Sibling Head in Object Detector［J］． 2020．

［8］ Li A ， Yang X ， Zhang C ． Rethinking Classification and Localization for Cascade R－CNN［J］． 2019．

［9］ Wu， Y．， Chen， Y．， Yuan， L．， Liu， Z．， Wang， L．， Li， H．，＆ Fu， Y．（2019）． Rethinking Classification and Localization in R－CNN． ArXiv， abs／1904．06493．

［10］ Liu， Y．， Wang， Y．， Wang， S．， Liang， T．， Zhao， Q．， Tang， Z．，＆ Ling， H．（2020）． CBNet： A Novel Composite Backbone Network Architecture for Object Detection． ArXiv， abs／1909．03625．

CVPR2020 | 夜间检测挑战赛两冠一亚，为自动驾驶保驾护航

相关推荐