计算机视觉——SSD和YOLO简介
前言
本文记录用,防止遗忘
计算机视觉——SSD和YOLO简介
课件(单发多框检测SSD)
生成锚框
- 对每个像素,生成多个以它为中心的锚框
- 给定n个大小 s1, ...,s2,和m个高宽比,那么生成 n+m-1 个锚框,其大小和高宽比分别为:(s1,r1),(s2,r1),...,(sn,r1),(s1,r2),...,(s1,rm),
-
SSD模型
- 一个基础网络来抽取特征,然后多个卷积层块来减半高宽
- 在每段都生成锚框:底部段来拟合小物体,顶部段来拟合大物体
- 对每个锚框预测类别和边缘框
-
效果
总结
- SSD通过单神经网络来检测模型
- 以每个像素为中心的产生多个锚框
- 在多个段的输出上进行多尺度的检测
-
课件(YOLO)
YOLO(你只看一次)
- SSD中锚框大量重叠,因此浪费了很多计算
- YOLO将图片均匀分成S×S个锚框
- 每个锚框预测B个边缘框
- 后续版本(V2,V3,V4...)有持续改进
-
效果
参考:https://www.codeasks.com/blog/view/1315567.html