YOLO理解 - 你们干嘛呢

转：https://www.cnblogs.com/fariver/p/7446921.html

结论：

(1) 速度更快(实时)：yolo(24 convs) -> 45 fps，fast_yolo(9 convs) -> 150 fps

(2) 全图为范围进行检测(而非在建议框内检测)，带来更大的context信息，使得相对于Fast-RCNN误检率更低，但定位精度欠佳。

YOLO损失函数

Loss = $λ c o o r d$

$λ c o o r d$

根据这个损失函数，迭代训练网络。

(1) 整个损失函数针对边界框损失(图中1, 2, 3部分)与格子(4部分)主体进行讨论。

(2) 部分1为边界框位置与大小的损失函数，式中对宽高都进行开根是为了使用大小差别比较大的边界框差别减小。例如，一个同样将一个100x100的目标与一个10x10的目标都预测大了10个像素，预测框为110 x 110与20 x 20。显然第一种情况我们还可以失道接受，但第二种情况相当于把边界框预测大了一倍，但如果不使用根号函数，那么损失相同，都为200。但把宽高都增加根号时：

显然，对小框预测偏差10个像素带来了更高的损失。通过增加根号，使得预测相同偏差与更小的框产生更大的损失。但根据YOLOv2的实验证明，还有更好的方法解决这个问题。

(3) 若有物体落入边界框中，则计算预测边界框含有物体的置信度 $C_{i}$

和真实物体与边界框IoU $\hat{C_{i}}$

的损失，我们希望两差值越小损失越低。

(4) 若没有任何物体中心落入边界框中，则 $\hat{C_{i}}$

$\hat{C_{i}}$

(s q r t (20) - s q r t (10)) 2 = 3 (s q r t (110) - s q r t (1

发表于 2018-04-11 10:11 你们干嘛呢阅读(328) 评论(0) 收藏举报