SPP Net
RCNN对每个候选框都提取了特征,而且对于有重复区域的候选框们,这部分重复的区域相当于不断重复提取了特征,很麻烦。所以能不能只提取一次特征呢?也就是只卷积一次。
R-CNN对候选框尺寸进行了wrap, 全都改为227x227,改变尺寸势必会影响到检测效果,所以能不能不改变尺寸?
因此SPP提出的更新:取消了crop/warp图像归一化过程,采用空间金字塔池化(SpatialPyramid Pooling )替换了 全连接层之前的最后一个池化层(因为rcnn提取的是Pool5层的特征):
SPP结构图:
存在的不足:
1)和RCNN一样,训练过程仍然是隔离的,提取候选框 | 计算CNN特征| SVM分类 | Bounding Box回归独立训练,大量的中间结果需要转存,无法整体训练参数;
2)SPP-Net在无法同时Tuning在SPP-Layer两边的卷积层和全连接层,很大程度上限制了深度CNN的效果;
3)在整个过程中,Proposal Region仍然很耗时。