mobileNet v2
MobileNet95%的计算时间都花费在1x1的逐点卷积上,并且占参数量的75%,如表2所示。其他额外的参数几乎都集中于全连接层。
主要还是采用depth-wise卷积和point-wise卷积来提取特征,很大程度上减少了参数量。
结构图:
升级点:
采用残差结构
在depthwise卷积之前先升维,因为作者认为DW因为计算特性,上层传来多少通道就只能输出多少通道,传来的通道数少的话
,只能在低维空间中提取特征,效果不好。所以在DW之前加了一个PW卷积,先升维,再卷积,再降维。并且加入升维系数控制着。
让dw提取到更多的特征。
在dw和pw之后的激活函数改为线性函数,因为作者认为激活函数对于低维特征会有破坏,不如线性函数。
整个网络并没有采用pooling进行下采样,而是利用stride=2来下采样
与resnet采用相同的1*1,3*3,1*1的模式,但是,resnet是先降维后升维;moblienet是先升维后降维,前者是沙漏型,后者是纺锤型。
凤舞九天