计算机视觉——SSD和YOLO简介

前言

本文记录用，防止遗忘

计算机视觉——SSD和YOLO简介

课件（单发多框检测SSD）

生成锚框

对每个像素，生成多个以它为中心的锚框
给定n个大小 s1, ...,s2,和m个高宽比，那么生成 n+m-1 个锚框，其大小和高宽比分别为:(s1,r1),(s2,r1),...,(sn,r1),(s1,r2),...,(s1,rm),
SSD模型
一个基础网络来抽取特征，然后多个卷积层块来减半高宽
在每段都生成锚框：底部段来拟合小物体，顶部段来拟合大物体
对每个锚框预测类别和边缘框
效果

总结
SSD通过单神经网络来检测模型
以每个像素为中心的产生多个锚框
在多个段的输出上进行多尺度的检测
课件（YOLO）

YOLO（你只看一次）
SSD中锚框大量重叠，因此浪费了很多计算
YOLO将图片均匀分成S×S个锚框
每个锚框预测B个边缘框
后续版本(V2,V3,V4...)有持续改进
效果

参考:https://www.codeasks.com/blog/view/1315567.html

posted @ 2023-02-07 14:39 @specter 阅读(151) 评论(1) 编辑收藏举报

刷新页面返回顶部