近期一直忙于做项目,没有对一些知识点总结,这里总结一篇项目中用到的basebone的论文,ShuffleNetV1
(纯属于个人笔记,只记一些点,需要说明详细网上有几个说明的不错,比如:https://blog.csdn.net/u011974639/article/details/79200559 )
论文下载: https://arxiv.org/pdf/1707.01083.pdf
论文核心点: 为了克服 群卷积(group convolutions)机制 带来的 副作用,作者提出了一个channel shuffle的操作,以帮助信息在feature map中流通.
channel shuffle 的操作:
上面给的参考链接说明很清楚 转置操作:https://blog.csdn.net/u011974639/article/details/79200559
shuffle unit 计算量问题:
为什么在 1*1Gconv 是 cm/g*h*w,这是 group conv的操作,这是AlexNet上就介绍过的(图来自:https://blog.csdn.net/zhangjunhit/article/details/90763234,盗图一下):
主要骚操作在 通道shuffle,且可微, 其他主要是模型对比,实验结果等