YOLOv4: Optimal Speed and Accuracy of Object Detection

YOLOv4: Optimal Speed and Accuracy of Object Detection

2020-04-26 11:28:45

Paper: https://arxiv.org/abs/2004.10934

Code: https://github.com/AlexeyAB/darknet

Other collection for the Implementation: link

1. Background and Motivation:

如图 1 所示，本文 YOLO-v4 在精度和速度上，取得了较好的平衡。

大部分基于 CNN 物体检测算法仅适用于推荐系统。例如，通过城市视频摄像头来搜索免费的停车位，这个过程是通过 slow accurate models 来实现的，而车辆碰撞警告是通过快速的不准确模型来实现的。因此一个实时的准确的物体检测模型，是非常重要的。本文就想构建一种物体检测模型来实现一个快速的算法，但是还要求能在单个普通的 GPU 上进行训练。为了上述目标，作者提出如下的贡献：

1). 作者开发了一种有效地、强大的物体检测模型。其可以利用 1080TI 或者 2080TI 显卡来训练一个超级快速和准确地物体检测器；

2). 作者验证了顶尖的 Bag-of-Freebies 和 Bag-of-Specials 方法的影响；

3). 修改了顶尖的算法，使得他们更加适合单张 GPU 训练，包括 CBN, PAN, SAM, 等。