论文阅读 | MobileNetV2: Inverted Residuals and Linear Bottlenecks

Motivation

MobileNet V2 是对MobileNetV1的一个改进.
MobileNet V2 主要提出两方面的改进：
- Linear Bottlenecks：在维度较小的 1x1 卷积之后不再采用ReLU操作，避免对特征的破坏。
- Inverted Residuals：与传统resnet结构中先对bottlenecks降维再复原不同，这里先用一个expand layer进行升维，然后再depthwise concolution最后再1x1降维复原。

Depthwise Separable Convolutions

MobileNet V2 依然使用 Depthwise Separable Convolutions 结构，这里不再详细阐述。

Linear Bottlenecks

对于ReLU函数，文章中有两个结论：

If the manifold of interest remains non-zero vol-ume after ReLUtransformation, it corresponds toa linear transformation.
ReLU is capable of preserving complete information about the input manifold, but only if the input manifold lies in a low-dimensional subspace of the input space.

这两个观点为我们优化现有的神经结构提供了一个经验提示：假设感兴趣的流形是低维的，我们可以通过在卷积块中插入线性瓶颈层来捕捉这一点。实验证据表明，使用线性层是至关重要的，因为它可以防止非线性破坏过多的信息。

对于一个输入图像，首先通过一个随机矩阵T将数据转换为n维，然后对这n维数据进行ReLU操作，最后再使用T的逆矩阵转换回来，实验发现当n很小的时候，后面接ReLU非线性变换的话会导致很多信息的丢失。

为了减少信息丢失，就有了文中的linear bottleneck，意思就是bottleneck的最后输出不接非线性激活层，只做linear操作，即维度缩减的那一层不加ReLU.

Inverted Residuals

MobileNet 主要的创新就是使用DepthWise Convolution layer层来降低计算量，但是它提取得到的特征受限于输入的通道数，若是采用以往的residual block，先“压缩”，再卷积提特征，那么DWConv layer可提取得特征就太少了，因此一开始不“压缩”，一开始先“扩张”，本文实验“扩张”倍数为6。 MobileNetV2为 “扩张”→“卷积提特征”→ “压缩”，因此称为Inverted residuals.

ResNet 与 MobileNet V2 的不同之处为：ResNet是先压缩后扩张，而MobileNet V2 是先扩张后压缩。

MobileNetV2相比MobileNetV1主要多了两点：

depth-wise convolution之前多了一个1*1的卷积扩张层，提升通道数量，获得更多特征
最后不采用ReLU，防止ReLU操作丢失低维特征

参考

1.MobileNetV2: Inverted Residuals and Linear Bottlenecks
2.https://zhuanlan.zhihu.com/p/37851650
3.https://blog.csdn.net/u011995719/article/details/79135818
4.https://zhuanlan.zhihu.com/p/33075914

posted @ 2020-08-08 18:50 小小凤~ 阅读(757) 评论(0) 编辑收藏举报

刷新页面返回顶部

每一个不曾起舞的日子，都是对生命的辜负！

论文阅读 | MobileNetV2: Inverted Residuals and Linear Bottlenecks