深度学习算法原理——RCNN

相比较于图像分类来说,目标检测(Object Detection)不仅需要标记出图像中的物体(通常使用边框标记),同时需要指出该物体是什么。一般比较直观的想法包括以下的三个步骤:

  • 得到目标的可能区域,称之为候选区域;
  • 使用图像特征的提取方法提取出候选区域的特征;
  • 利用分类模型对该候选区域分类;

RCNN(Region with CNN features),又称为基于区域的卷积神经网络,也是基于上述的思路的一种目标检测的方法,基本的思路如下图所示:

深度学习算法原理——RCNN_第1张图片
与上述过程一致,RCNN包括了三个模块:

  • 区域提名;用于生成与类别无关的区域。
  • CNN;对上述生成的区域提取出特征。
  • SVM分类器;对提取出的图像特征分类。

其基本过程为从输入图像中提出去2000个左右的候选区域,对每一个候选区域计算其特征,最红利用分类模型对这个2000个左右的候选区域分类,从而得到最终的检测目标以及每一个目标对应的类别。

1. 区域提名的方法

在RCNN中,使用的是选择性搜索作为区域提名的方法。

2. 减少定位错误

在实际过程中,使用Bounding box regression来提升目标框的检测准确率。

你可能感兴趣的:(深度学习Deep,Learning)