模型压缩(3) - ShuffleNet

ShuffleNet: An Extremely Efficient Convolutional Neural Network for Mobile Devices

论文地址：Arxiv Paper

主要是在Xception的基础上进一步改进

Motivation:

Xception / ResNeXt 这种优化结构对于extremely small network的计算性能欠佳

因为conv1x1耗时过长(在MobileNet中已验证)

受AlexNet的启发，提出了group convolution，提高conv1x1的计算性能
Group convolution 的引入有局限性

提出了channel shuffle增加了feature channel之间信息的流动性

ShuffleNet units

图(a) ，带有depthwise conv的bottleneck module

由三个部分组成：

point wise 1x1 conv + Xception中的depthwise 3x3 conv + point wise 1x1 conv

前面两个op组合构成了Xception，最后一个为了shortcut的channel匹配