Bounding-Box(BB)regression

最近在学习RCNN,对于Bounding-Box(BB)regression能够提高边界框的精确度,对于其内容产生了很大兴趣。

主要内容学习自大神博客:https://blog.csdn.net/bixiwen_liu/article/details/53840913  侵删

这张图很有代表性,红色region proposal为ss算法产生的候选区域,绿色的ground truth为真实边框。即便红色边框圈出了飞机,但是因为iou<0.5被认为是没有检测出飞机,如果我们能够对region proposl进行微调,使得该窗口与ground truth更为接近,这样定位就会变得准确。

首先不想其他的,如果是我们自己来做,怎么让红框更趋向于绿框,能想到比较简单的办法就是把红框进行拉伸或缩小然后平移呗,这是很自然而然能够想到的。

其实论文也基本上是这么实现的:

注意:只有当Proposal 和Ground Truth 比较接近时(线性问题),我们才能将其作为训练样本训练我们的线性回归模型,否则会导致训练的回归模型不work(当Proposal跟GT 离得较远,就是复杂的非线性问题了,此时用线性回归建模显然不合理)。这个也是G-CNN: an Iterative Grid Based Object Detector 多次迭代实现目标准确定位的关键.



 

posted @ 2018-04-10 16:42  在下小白  阅读(390)  评论(0编辑  收藏  举报