目标检测项目

· 识别图片中有哪些物体并且找到物体的存在位置多任务:位置 + 类别目标种类与数量繁多的问题目标尺度不均的问题遮挡、噪声等外部环境干扰VOC数据集:PASCAL VOC挑战赛(The PASCAL Visual Object Classes)是一个世界级的计算机视觉挑战赛。4大类,20小类VOC 2007:9963图片 /24640目标VOC 2012:23080图片 /54900目标· COCO数据集:起源于微软2014年出资标注的MS COCO数据库。包含20万个图像80个类别超过50万个目标标注平均每个图像的目标数是7.2YOLO(TXT)格式:(x,y,w,h)分别代表中心点坐标和宽、高x,y,w,h均为归一化结果VOC(XML)格式:(Xmin,Ymin,Xmax,Ymax)分别代表左上角和右下角的两个坐标。COCO(JSON)格式:(Xmin, Ymin, W, H),其中x,y,w,h均不是归一化后的数值,分别代表左上角坐标和宽、高目标检测的评估指标生成的预测结果会非常多首先过滤掉低类别置信度的检测结果使用IoU作为边界框正确性的度量指标anchor box用ratio+scale描述feature map的点来决定位置scale来表示目标的大小(面积大小)aspect ratio来表示目标的形状(长宽比)anchor-baseanchor-base是自顶向下的类似于传统方法,滑动窗口法穷举出许多,然后再根据置信度之类的进行筛选anchor-freeanchor-free是自底向上的想办法自动生成,不穷举free掉了anchor的预设过程常见two stage算法经典发展线:R-CNN、SPP-Net、Fast R-CNN、 Faster R-CNN其他:Cascade R-CNN、Guided Anchoring 常见one stage算法YOLO系列:YOLO v1-v5SSD系列:SSD、DSSD、FSSD其他经典:RefineDet 非极大值抑制(Non-maximum suppression,NMS)设定目标框的置信度阈值,常用的阈值是0.5左右根据置信度降序排列候选框列表选取置信度最高的框A添到输出列表,将其从候选框列表删除候选框列表中的所有框依次与A计算IoU,删除大于阈值的候选框重复上述过程,直到候选框列表为空,返回输出列表

你可能感兴趣的:(神经网络,人工智能,pytorch,目标检测)