近期一直忙于做项目,没有对一些知识点总结,这里总结一篇项目中用到的basebone的论文,ShuffleNetV1

(纯属于个人笔记,只记一些点,需要说明详细网上有几个说明的不错,比如:https://blog.csdn.net/u011974639/article/details/79200559 )

论文下载:  https://arxiv.org/pdf/1707.01083.pdf

 

论文核心点: 为了克服 群卷积(group convolutions)机制 带来的 副作用,作者提出了一个channel shuffle的操作,以帮助信息在feature map中流通.

 

channel shuffle 的操作:

 

上面给的参考链接说明很清楚 转置操作:https://blog.csdn.net/u011974639/article/details/79200559

 

 

 

shuffle unit  计算量问题:

 

 为什么在 1*1Gconv 是 cm/g*h*w,这是 group conv的操作,这是AlexNet上就介绍过的(图来自:https://blog.csdn.net/zhangjunhit/article/details/90763234,盗图一下):

 

 

主要骚操作在 通道shuffle,且可微,  其他主要是模型对比,实验结果等