2.28 图像分类全解析:从境界到评估,再到模型与样本处理

图像分类

 

将不同的图像,划分到不同的类别标签,实现最小的分类误差。

 

图像分类的三层境界:

 

通用的多类别图像分类

子类细粒度图像分类

实例级图片分类

 

图像分类评估指标之混淆矩阵:

 

TP(True positive,真正例)——将正类预测为正类数。

FP(False postive,假正例)——将反类预测为正类数。

TN(True negative,真反例)——将反类预测为反类数。

FN(False negative,假反例)——将正类预测为反类数。

 

图像分类评估指标:

准确率(Precision):又称为查准率,表示在模型识别为正类的样本中,真正为正类的样本所占的比例。

F1_Score:它被定义为正确率和召回率的调和平均数

 

P-R曲线:

召回率增加,精度下降。

曲线和坐标轴面积越大,模型越好。

对正负样本不均衡敏感

 

多类别分类模型各个类别之间的分类情况

对于k分类问题,混淆矩阵为k*k的矩阵,元素Cij表示第i类样本被分类器判定为第j类的数量。

主对角线的元素之和为正确分类的样本数,其余元素之和为错误分类的样本数。对角线的值越大,分类器准确率越高。

 

模型基本概念-网络的深度:

 

深度学习最重要的属性,计算最长路径的卷积层+全连接层数量。LeNet网络,C1+C3+C5+F6+Output共5层

 

 

模型基本概念-网络的宽度:

 

每一个网络层的通道数,以卷积网络层计算。LeNet网络,C1(6),C3(16)。

 

图像分类中样本量过少的问题:

样本量极少:样本获取较难导致总体样本量过少

 

 

样本量过少的解决方案:

1.迁移学习:使用预训练模型。

  ImageNet数据集具有通用性,使用它进行预训练可加速模型收敛。

2.数据增强(有监督方法与无监督方法)

有监督方法:平移、翻转、亮度、对比度、裁剪、缩放等。

 

无监督方法:通过GAN网络生成所需样本,然后再进行训练

你可能感兴趣的:(机器学习,算法,人工智能)