计算机视觉(Computer Vision,CV)四大基本任务--分类、检测、定位、分割

文章目录

  • 前言
  • 一、计算机视觉任务一:目标分类
    • 常用数据集
    • 常见网络结构
  • 二、计算机视觉任务二:目标定位
  • 三、计算机视觉任务三:目标检测
    • 常用数据集
    • 常见网络结构
  • 四、计算机视觉任务四:目标分割
    • 常用数据集
    • 常见网络结构


前言

计算机视觉(Computer Vision,CV)是一门研究如何让机器具备“看”的能力的学科,以人或动物的视觉能力为参照,通过计算机对视觉数据(图像、视频等)的处理、学习、推理判断,复现出、模拟出甚至超过人或动物的某些视觉功能,赋予机器对客观世界的观察、发现、理解能力,进而提高机器的工作能力!!!
计算机视觉涵盖的内容丰富,需要完成的任务也非常多,但其中最基本的任务包含四项:分类、定位、检测和分割;可以说其他关键任务都是在四项基本任务的基础上延伸开来的。
下图是一副经典的示意图。
计算机视觉(Computer Vision,CV)四大基本任务--分类、检测、定位、分割_第1张图片

  • 一、计算机视觉任务一:目标分类

分类-Classification:解决“是什么?”的问题,即给定一张图片或一段视频判断里面包含什么类别的目标。对于一幅图像来说,分类就是聚类;对于一组图像样本来说,分类是检测出样本中有相同目标的图像。
如下图所示,将给出的图像分类到CAT这一类。

计算机视觉(Computer Vision,CV)四大基本任务--分类、检测、定位、分割_第2张图片

常用数据集

以下是几种常用分类数据集 。

你可能感兴趣的:(计算机视觉,计算机视觉,目标检测,深度学习)