计算机视觉——SSD和YOLO简介

前言

本文记录用,防止遗忘

计算机视觉——SSD和YOLO简介

课件(单发多框检测SSD)

生成锚框

  • 对每个像素,生成多个以它为中心的锚框
  • 给定n个大小 s1, ...,s2,和m个高宽比,那么生成 n+m-1 个锚框,其大小和高宽比分别为:(s1,r1),(s2,r1),...,(sn,r1),(s1,r2),...,(s1,rm),
  • 在这里插入图片描述

    SSD模型

  • 一个基础网络来抽取特征,然后多个卷积层块来减半高宽
  • 在每段都生成锚框:底部段来拟合小物体,顶部段来拟合大物体
  • 对每个锚框预测类别和边缘框
  • 在这里插入图片描述

    效果

    在这里插入图片描述

    总结

  • SSD通过单神经网络来检测模型
  • 以每个像素为中心的产生多个锚框
  • 在多个段的输出上进行多尺度的检测
  • 课件(YOLO)

    YOLO(你只看一次)

  • SSD中锚框大量重叠,因此浪费了很多计算
  • YOLO将图片均匀分成S×S个锚框
  • 每个锚框预测B个边缘框
  • 后续版本(V2,V3,V4...)有持续改进
  • 在这里插入图片描述

    效果

    在这里插入图片描述

 

 参考:https://www.codeasks.com/blog/view/1315567.html   

 

posted @ 2023-02-07 14:39  @specter  阅读(145)  评论(1编辑  收藏  举报