两阶段深度学习中的两阶段是指什么意思?

在CV领域,两阶段通常指两阶段目标检测算法,俗称2-stage。

以最为经典的2-stage算法Faster R-CNN为例进行说明:

第一阶段是为了区分前景和背景,仅做二分类,同时回归得到前景所在的区域范围,称作RoI(Region of Interest),通常用矩形框表示,俗称bbox (bounding box);

第二阶段利用RoI在CNN提取的特征图上抠取对应范围的特征,再次进行分类和回归预测。不同于第一阶段,此处的分类是多分类,需要区分出不同物体类别(而非仅仅是前景和背景)。而回归则是预测出物体所在的位置,通常也是用bbox表示。

可以将第二阶段理解为对第一阶段的精调:第一阶段仅仅做个“粗略”的预测,为的是尽量保持召回率(即尽量不要漏掉任何前景);第二阶段在第一阶段预测的基础上结合CNN提取的特征做进一步调整和预测,使得最终预测的结果更为精确。

通常来说,两阶段算法的精度较一阶段算法高,但在推理速度上却比不过后者。

以Faster RCNN为例的话,第一个阶段是Anchor Proposal 第二个阶段是框回归。你也可以理解为是两个模型混合。
 
posted @ 2022-07-04 15:48  小丑_jk  阅读(1268)  评论(0编辑  收藏  举报