目标检测(5) 吴恩达-卷积神经网络-目标检测笔记
3.1 目标定位
输入:图像 x*y
输出:y=[pc, bx, by, bw, bh, c1, c2, c3]
(pc的值域是0或1,表示这个位置有无目标,bx、by表示框的中心位置,bw、bh表示长和宽,c1~c3表示目标的类别,值域也是0和1)
loss=∑ (y1-y1')^2
3.2 特征点检测
3.3 目标检测
滑动窗口
3.4 卷积的滑动窗口实现
全连接层转换为卷积层
3.5 bounding box预测
yolo算法(非常重要)--》解决bounding box准确性问题
3.6 交叉比
IoU=真值区域和预测区域的交集/真值区域和预测区域的并集,一般大于0.5就很不错
3.7 非极大值抑制
解决存在多个有重复区域的框的问题,选出最合适的框
3.8 anchor boxes
解决一个框内有多个检测目标
3.9 YOLO算法
好是好,但感觉标注很麻烦啊
3.10 RPN网络(选修)
候选区域网络
R-CNN
fast R-CNN
faster R-CNN
这类网络主要分两大步:候选区域+分类
而yolo和ssd更快,因为他们把这两步合成一步