今天,全球计算机三大顶级会议之一ECCV 2020圆满落幕,深兰科技的DeepBlueAI团队包揽了GigaVision 2020挑战赛图像多类别目标检测和视频多目标跟踪双赛道冠军,有力推动了十亿级像素图像和视频的目标检测技术的发展。此外,还在VIPrios系列赛、Visdrone系列赛中获得了2个亚军和4个季军,一举囊括8个大奖。值得一提的是,该团队在由谷歌于Kaggle平台上举办的ECCV挑战赛Google Landmark Retrieval 2020上也收获了一枚金牌。
至此,深兰科技以在ICCV、CVPR和ECCV上分别取得了多个第一的优异战绩,实现了全球三大计算机视觉顶级会议挑战赛的大满贯。
此次深兰科技获得双冠的 GigaVision2020 挑战赛,是由清华大学基于其新推出的数据集PANDA(全球首个十亿像素级别视频数据集)而组织的,能够促进新的算法来理解更复杂的人群活动及社交行为,比如分析人群长时间,长距离的活动。其挑战赛的任务是两类经典的视觉任务:图像多类别目标检测和视频多目标跟踪。参赛过程中,团队要求检测行人和车辆两类目标以及提交行人在视频中的轨迹。
GigaVision挑战赛的难点颇多,比如参赛团队在PANDA上进行检测的过程中必须同时要解决准确性和效率的问题。准确性很容易受到明显的目标尺度变化和复杂遮挡的影响,而效率很大程度上会被十亿像素级别的分辨率所影响。同时,巨大的同类目标尺度变化、对长时间长距离追踪的需求和行人拥挤、相互遮挡的复杂场景都让此挑战赛难度倍增。
深兰科技DeepBlueAI团队在检测赛道时将任务解耦为多个子任务,把难点独立出来重点解决,并根据以往检测经验,通过所积累的模块和方法,使得结果有了进一步的提升。最终,第二、三名只有千分之几的分差,而DeepBlueAI团队的最好成绩领先第二名2.6个百分点,强势获得冠军。
除了GigaVision 2020挑战赛的双赛道冠军外,深兰还在VIPrios系列赛、Visdrone系列赛中获得了2个亚军、4个季军以及1项Kaggle金牌
VIPriors Image Classification Challenge 亚军
该赛题是一个图像分类任务,难点是如何不使用任何预训练模型从头开始训练,主要目标是如何在ImageNet的子集上获得最高的准确率。
Visdrone-task3 Multi-Object Tracking 亚军
该赛题要求基于无人机视角拍摄的视频,进行多类别多目标跟踪任务,DeepBlueAI团队基于Tracking-by-detection的方法,逐步优化检测器、特征提取器、数据关联。
VIPriors Object Detection Challenge 季军
该赛题的数据集是部分MSCOCO数据集,赛题任务是是利用少量数据集在不使用任何预训练模型的基础上,进行80个类别的目标检测。
VIPriors Action Recognition Challenge 季军
此为动作识别挑战赛,需要从头训练模型以完成基于UCF101数据集101种动作识别任务。
Visdrone-task1 Object Detection 季军
该赛题要求基于无人机视角拍摄的图片,对车辆、行人等目标进行定位分类,DeepBlueAI团队基于CascadeRCNN的方法,逐步优化数据增强方法、特征提取器、后处理等。
OpenEDS Sparse Semantic Segmentation Challenge 季军
该赛题要求基于VR设备内部拍摄到的眼睛图片,将眼睛关键区域分割成巩膜,虹膜,瞳孔,参赛过程中,DeepBlueAI团队基于Unet结构,并结合了数据增强,注意力机制等方法。
Google Landmark Retrieval 2020 Kaggle金牌
该赛题要求参赛者对收集到的大量地标建筑物图像进行检索,DeepBlueAI团队基于Global feature、优化数据增强、特征提取网络等方法,最终取得金牌一枚。
过去十年中,以行人检测、跟踪、动作识别、异常检测、属性识别等以人为中心的计算机视觉一直在人工智能产业中占据着十分重要的地位,逐步成为自动驾驶,智能零售,智慧安防等领域发展的支撑。作为核心技术之一,深兰在计算机视觉方面的实力已在多项国际顶级竞赛中得以验证,并已应用于不同领域的产品中,包括因为在疫情期间发挥重大作用被工信部点赞的深兰AI热感视觉行为监控系统-猫头鹰,在广州、深圳、武汉、上海、长沙等多地获得自动驾驶路测牌照的熊猫智能公交车,以及各类机器人和智能零售产品等。ECCV载誉归来,为日后更多“服务民生”产品的奠定了基础。
成绩单
CVPR、ECCV 和 ICCV 三大国际顶会被公认为计算机视觉领域的最高水平。作为AI行业的领军企业,深兰一直是三大顶会的积极参与者,此次ECCV夺冠,实现了计算机视觉三大顶级会议的大满贯。未来,深兰还将坚持基础研究和应用开发双落地,夯实计算机视觉技术,谱写“人工智能,服务民生”的篇章。