深度可分离卷积_主干网络系列(6) - Xception: 使用深度可分离卷积的深度学习

深度可分离卷积_主干网络系列(6) - Xception: 使用深度可分离卷积的深度学习_第1张图片

论文地址: Xception: Deep Learning with Depthwise Separable Convolutions
工程代码: Github链接0. 摘要
该论文对Inception模块做了新的解释,认为Inception模块是常规卷积神经网络到深度可分离卷积神经网络的过渡手段,基于这种思想,深度可分离卷积可以看作一个具有最大数量tower的Inception模块(tower是指Inception模块中各个path的数量)。这样通过使用深度可分离卷积来代替Inception模块产生了一个新的网络架构,即Xception(Extreme Inception)。Xception在ImageNet上的效果比InceptionV3略好(InceptionV3是针对ImageNet设计的),在更大的数据集上Xception效果相比InceptionV3显著提升。由于二者的参数量相同,所以效果的提升并不是由于模型容量的增加,而是因为更高效的模型参数的利用。
1. 简介
卷积神经网络是计算机视觉领域的主要算法,其设计是一个引起学界高度关注的话题。卷积神经网络的历史要追溯到LeNet结构的模型,它通过简单的堆叠用于特征提取的卷积层和用于下采样的最大池化层来完成构造,这种思想也被用于AlexNet,其中卷积操作和最大池化操作多次重复,以使网络在每个空间维度都能提取到更加丰富的特征。之后网络设计的趋势就是不断加深,例如VGG-nets。
这之后新的网络被提出,即Inception架构,目前已经有四种版本,包括Inception V1(GooLeNet),Inception V2,Inception V3和Inception V4(Inceotion-Resnet)。Inception模块受到NiN架构的影响,已经提出,就成为ImageNet数据集上变现最好的网络族之一(之前提到过Inception模块的设计具有很强的针对性,模型泛化到其他数据集上效果并不好)。
网络的基础模块是Inception模块,它有几种变体,比如下图所示的是一个典型的Inception模块,在Inception V3中有应用

你可能感兴趣的:(深度可分离卷积)