YOLOv3

YOLOv3

作者:Joseph Redmon

CVPR'18

paper:YOLOv3: An Incremental Improvement

亮点

  • 提出新的backbone-darknet53
  • 没有池化层和全连接层
  • 增加了分支,用于检测小目标对象(13$\times\(13, 26\)\times\(26, 52\)\times$52)

网络结构

YOLOv3除去了池化层和全连接层,用卷积操作代替。

引入了残差结构,使得backbone更深。

对不同层的输出进行上采样拼接,增加了2条分支,用于预测小目标。每条分支最后的输出深度为255,原因是每条分支包括3个anchor,并且针对COCO80个种类设计,每个位置需要预测4个偏移量和1个置信度,3\(\times\)(5+80)=255

bounding box的预测:和YOLOv2类似,每个网格的左上角坐标为\((c_x,c_y)\),bounding box有先验长宽,使用预测值调整bounding box的边界。

每个框有个objectness分数(置信度,逻辑回归预测),bbox和GT的IOU大于0.5并且IOU最大的为1,作为正样本;其余大于0.5的舍弃,小于0.5的作为负样本,这样做可以舍弃不必要的anchor,减少计算。

如果一个bbox没有被分配到GT,就不计算候选框损失和分类损失,只计算objectness损失。

分类预测:没有使用softmax分类器。

posted @ 2021-08-18 16:28  xiaowk5516  阅读(62)  评论(0编辑  收藏  举报