针对单视图深度估计任务,研究人员选择了自监督方法的Monodepth2模型并与其在KITTI上训练的结果进行了比较。下图显示基于Holopix训练的结果图像较为清晰,边缘也得到了更好的保留,a列为KITTI上训练的结果、b列为Holopix50k上训练的结果。
下表展示了模型在Middlebury和MPI数据集上测试的结果,表明这一数据集同样可以适用于道路等多种数据集不包含的场景中,让模型可以学到具有泛化性的结果。
针对视差估计任务,研究人员基于U-Net构建了自己的模型,同时还优化后得到了较小的实时视差估计模型,利用Pix2Pix类似的架构来构建单目深度估计模型,下图a,b,c分辨显示了立体视差估计、实时视差估计和单目深度估计的结果。视差估计可以很好的区分出场景中的不同目标,经过优化后的模型只有约15k参数能够部署于边缘设备中;而针对单目深度估计则可以在没有先验的条件下得到可观的深度层次结果。
这里只是简要地列举了一些数据集的特征和应用任务,如果想要了解更多的细节请参看数据集网站。