零基础,快速学YOLO目标检查算法(YOLO—v1,2,3快速学习)

一.深度学习经典检测方法

1.two-stage(两阶段):Faster-rcnn Mask-Rcnn系列,先有预选,预选完之后再通过预选得到最终结果。速度通常较慢,但效果不错

2.one-stage(单阶段):YOLO系列,普通回归任务。最核心的优势,速度非常快,适合做实时检测任务,但效果通常情况不会太好

二.指标分析

map指标:综合衡量检测效果。精度:检测到的一个东西跟实际是否吻合。recall:有没有一些没检测到。IOU:(真实值和预测值)交集/并集

precision=tp/(tp+fp)

recall=tp/(tp+fn

tp:在做对的情况下判断成正例.本来是正例,并且预测成了正例

fp:做错的情况下把它判断成了正例。本身是一个负例,错误地判断成正例

fn:错误地把它判断成了负例,本来是一个正例,错误判断成了正例

tn:错误地判断成了正例,本身是一个负例,正确判断成了负例

置信度:比如当前这个框是一个人脸的可能性

三.YOLO-v1

经典的one-stage方法,You Only Look Once 

把检测问题转化为回归问题 比如经典检测问题中,我们需要起始位置,再需要一个长,宽(x,y,w,h),一个CNN搞定(卷积神经网络)

提出两种候选框,那个IOU大就选哪个微调

需要预测Bounding boxes(x,y,w,h) + confidence(置信度,这个点对应的是物体的可能性是多大)

核心思想:

分为s*s的格子,在每一个格子中产生两种候选框,每个格子要预测一个置信度,置信度大于我们所设置的阈值留下。再对留下的格子产生的两种候选框做一个筛选,IOU大的那一个留下,算出xywh,即把这个框算出来了

整体网络架构解读:

零基础,快速学YOLO目标检查算法(YOLO—v1,2,3快速学习)_第1张图片

首先第一步我们拿到一个输入图像(v1版本中指定输入大小为448*448*3) 

卷积神经网络都有

co

你可能感兴趣的:(YOLO)