目标检测(5) 吴恩达-卷积神经网络-目标检测笔记

3.1 目标定位
输入:图像 x*y
输出:y=[pc, bx, by, bw, bh, c1, c2, c3]
(pc的值域是0或1,表示这个位置有无目标,bx、by表示框的中心位置,bw、bh表示长和宽,c1~c3表示目标的类别,值域也是0和1)

loss=∑ (y1-y1')^2

3.2 特征点检测

3.3 目标检测
滑动窗口

3.4 卷积的滑动窗口实现
全连接层转换为卷积层

 

3.5 bounding box预测
yolo算法(非常重要)--》解决bounding box准确性问题

3.6 交叉比
IoU=真值区域和预测区域的交集/真值区域和预测区域的并集,一般大于0.5就很不错

3.7 非极大值抑制
解决存在多个有重复区域的框的问题,选出最合适的框

3.8 anchor boxes
解决一个框内有多个检测目标

3.9 YOLO算法
好是好,但感觉标注很麻烦啊

3.10 RPN网络(选修)
候选区域网络
R-CNN
fast R-CNN
faster R-CNN
这类网络主要分两大步:候选区域+分类
而yolo和ssd更快,因为他们把这两步合成一步

 

posted @ 2018-08-01 14:34  0点618  阅读(416)  评论(0编辑  收藏  举报