小型目标检测模型调研


一、简介、概述

1、目标检测:目标检测(Object Detection)的任务是找出图像中所有感兴趣的目标(物体),确定它们的类别和位置,是计算机视觉领域的核心问题之一。由于各类物体有不同的外观、形状和姿态,加上成像时光照、遮挡等因素的干扰,目标检测一直是计算机视觉领域2最具有挑战性的问题。

2、小型目标定义:
相对尺度定义
        从目标与图像的相对比对小目标进行定义。Chen等提出了一个针对小目标的数据集,对小目标进行定义:同一类别中,所有目标实例的相对面积,即边界框面积与图像面积之比的中位数在0.08%~0.58%之间。如在640× 480 \times480×480像素分辨率图像中,16 × 16 16\times1616×16到42 × 42 42\times4242×42的目标应考虑为小目标。
除了Chen的定义,其他的相对定义有:

目标边界框的宽高与图像的宽高比例小于一定值,通用值为0.1
目标边界框与图像面积的比值开方小于一定值,通用值为0.03
根据目标实际覆盖像素与图像总像素之间比例对小目标进行定义
相对尺度的定义存在问题,如这种定义方式难以有效评估模型对不同尺度目标的检测性能,同时容易受到数据预处理与模型构型的影响。

绝对尺度定义
        从目标绝对像素大小对小目标进行定义。目前最为通用的定义来自MS COCO数据集,将小目标定义为分辨率小于32 × 32 32\times3232×32像素的目标。
为什么是32 × 32 32\times3232×32,文中提出了两种思路:
        人类在图像上对于场景能有效识别的彩色图像像素大小为32 × 32 32\times3232×32,小于32 × 32 32\times3232×32的人眼无法识别
        VGG网络从输入图像到全连接层的特征向量经过了5个最大池化层,因此,对于特征向量上的“一点”对应于输入图像32 × 32 32\times3232×32个像素
除了MS COCO数据集,还有其他小目标的绝对尺度定义

         航空图像数据集DOTA和人脸检测数据集WIDER FACE将像素范围在[10,50]之间的目标定义为小目标
行人识别数据集CityPersons:

        针对行人,将小目标定义为高度小于75像素的目标;基于航空图像的小行人数据集TinyPerson将小目标定义为像素值范围在[20,32]之间的目标,而且进一步将像素值范围在[2,20]之间的目标定义为微小目标。

3、综述(含应用方向)

2022最新小目标检测综述 | 面向大规模场景的小目标检测:综述和 benchmark - 知乎 (zhihu.com)

二、模型介绍

1、小目标检测模型总结+SNIP+SNIPER_小目标检测模型有哪些_M1kk0的博客-CSDN博客

2、目标检测算法——小目标检测_TigerZ*的博客-CSDN博客

三、技术难点

1、目标检测难点-小物体检测 - 知乎 (zhihu.com)

2、目标检测—ArcGIS Pro | 文档

你可能感兴趣的:(目标检测,目标跟踪,人工智能)