论文阅读笔记---ShuffleNet V1

01 ShuffleNet V1要解决什么问题

为算力有限的嵌入式场景下专门设计一个高效的神经网络架构。

使用了两个新的操作：pointwise group convolution和channel shuffle。

根据这两个操作构建了ShuffleUnit，整个ShuffleNet都是由ShuffleUnit组成。

所谓的的pointwise group convolution就是分组卷积与1x1卷积的结合！！！

shuffle的步骤如下:

图(a)是残差卷积模块，标准3×3卷积转换为深度可分离卷积与1×1卷积的组合。中间加上BN和ReLU，构成基本单元。

图(b)是Shuffle Unit，将图(a)中的第一个1×1卷积替换成1×1组卷积（GConv）和channel shuffle组成的单元。

图(c)是用于降采样的Shuffle Unit，深度可分离卷积的步长改为2，为了适配主分支的feature map，在shortcut上加上了步长也为2的平均池化（AVG Pool 3×3 ）。

超参数如组卷积的组数以及通道压缩比率等需要根据实际情况决定，不同任务下需要自行调整。
网络实时性并不能单纯以浮点计算量来衡量，还存在memory access cost(MAC)等因素的干扰，并不能仅仅根据计算量就认为ShuffleNet是最快的。
通道的Shuffle是人工设计的，不是模型自己学习的，不符合网络通过负反馈自动学习特征的基本原则，又陷入人工设计特征的老路！

posted @ 2019-09-17 22:15 珠峰上吹泡泡阅读(561) 评论(0) 编辑收藏举报

刷新页面返回顶部