到底什么是 ROI Pooling Layer ???
到底什么是 ROI Pooling Layer ???
只知道 faster rcnn 中有 ROI pooling, 而且其他很多算法也都有用这个layer 来做一些事情,如:SINT,检测的文章等等。那么,到底什么是 ROI pooling 呢???
参考:http://blog.csdn.net/lanran2/article/details/60143861
在 faster rcnn 中,RPN 会产生很多的候选 proposal,这里出来的是 BBox 的位置,也就是我们感兴趣的区域,即: region of interest (ROI) 。
ROI pooling 操作的对象就是这些 proposal (BBOx)。
==>> ROI Pooling 的输入是:
1. RPN layer 前面的 feature map,
2. RPN 输出的 BBOx,形状为:1*5*1*1 (4个坐标 + 索引 index);
==>> ROI Pooling 的输出是:
mini-batch 个 vector,batch的值是 ROI 的个数,vector的长度为:channel * w * h;
整个 ROI 的过程,就是将这些 proposal 抠出来的过程,得到大小统一的 feature map。
Stay Hungry,Stay Foolish ...