目标检测相关术语
iou
使用loU看检测是否正确需要设定一个阈值,最常用的阈值是0.5,即如果loU>0.5,则认为是真实的检测
P代表每张图像中被检测出的正确目标占总目标数的多少;
AP代表对于一个类别,假如100张图像,计算平均精度;分子是图像的个数,分母是总精度的和;
MAP=所有类别的平均精度求和除以所有类别 ;
AP50,AP60
以Cascade R-CNN的一张图为例,AP50,AP60,AP70……等等指的是取detector的IoU阈值大于0.5,大于0.6,大于0.7……等等。可以看到数值越高,精确率越低,表明越难
ROI
感兴趣区域,往往是需要检测的目标
Hard negative mining
难检测负样本挖掘
hard negative就是当你得到错误的检测patch时,会明确的从这个patch中创建一个负样本,并把这个负样本添加到你的训练集中去。当你重新训练你的分类器后,分类器会表现的更好,并且不会像之前那样产生多的错误的正样本。
multi reference detection
多参考检测,直观理解多个检测器。ssd中是用卷积进行检测,最终有8732个卷积detector。
或者是ASPP模块,采用空间金字塔池化技术获取上下文信息(场景信息);这地方理解的不是很清楚,应该是多个检测器。
纠正,最终理解是anchors boxes机制,这里的anchors boxes就是代表了多个检测器,所以第一种理解是对的。
multi resolution detection
多分辨率检测,例如ssd,对于多尺度特征图进行检测;FPN中的多尺度特征图,retinanet中的多尺度特征图等;refinenet中的融合不同分辨率特征图信息;
列出yolo v3和 ssd的结构图更加明显的表示出含义:
YOLO V3结构图,橙色为detection layer
SSD结构图,倒数第二列是detections
多尺度检测技术演进路线图:
常用数据集:
通用目标检测领域常用数据集
行人检测常用数据集
人脸检测常用数据集
文本检测常用数据集
交通灯检测与交通标志检测常用数据集
凤舞九天