RetinaNet论文理解

引言

介绍

目前精度高的检测器都是基于two-stage，proposal-driven机制，第一阶段生成稀疏的候选对象位置集，第二阶段使用CNN进一步将每个候选位置分为前景或者背景以及确定其类别；
提出一个one-stage检测器可以匹配two-stage检测器在COCO上AP，例如FPN、Mask R-CNN，为了到达这一结果针对训练过程中类别不平衡这个阻碍问题，设计出一个新的loss，focal loss；
R-CNN类检测器可以通过two-stage级联和启发式采用来解决class imbalance问题，proposal stage包括：Selective Search、EdgeBoxes、DeepMask、RPN，可以迅速候选区域数目降低过滤大量background样本；在第二个分类stage启发式采样，可以采取的策略有：固定前景和背景的比例1:3或者采用OHEM在线困难样本挖掘，可以用来维持前景和背景样本可操作性平衡；
one stage检测器需要处理更大的候选位置集，虽然也应用了同样的启发式采样，但是效率低下因为在训练过程中很容易受到简单背景样本的支配；这种低效率问题是目标检测的典型问题，对此典型的解决方法是bootstrapping、HEM；
focal loss是一个能够动态缩放的cross entropy loss，当正确类别的置信度提高时缩放因子衰减为0，缩放因子可以自动降低easy例子在训练期间贡献loss的权重，使得模型注重hard例子；
为了验证focal loss的有效性设计了一种one-stage的目标检测器RetinaNet，它的设计利用了高效的网络特征金字塔以及采用了anchor boxes，表现最好的RetinaNet结构是以ResNet-101-FPN为bakcbone，在COCO测试集能达到39.1的AP，速度为5fps；

创新点

1、Focal Loss:

2、RetinaNet:

为了评估focal loss的有效性，设计和训练出了RetinaNet，在使用focal loss对RetinaNet进行训练时可以匹配之前的one-stage的方法，同时在精度上超过了目前所有的two-stage检测器

posted @ 2019-03-02 10:53 深夜十二点三十三阅读(5466) 评论(0) 编辑收藏举报

刷新页面返回顶部

登录后才能查看或发表评论，立即登录或者逛逛博客园首页

【推荐】还在用 ECharts 开发大屏？试试这款永久免费的开源 BI 工具！
【推荐】编程新体验，更懂你的AI，立即体验豆包MarsCode编程助手
【推荐】凌霞软件回馈社区，博客园 & 1Panel & Halo 联合会员上线
【推荐】抖音旗下AI助手豆包，你的智能百科全书，全免费不限次数
【推荐】博客园社区专享云产品让利特惠，阿里云新客6.5折上折
【推荐】轻量又高性能的 SSH 工具 IShell：AI 加持，快人一步

编辑推荐：
· 为什么说在企业级应用开发中，后端往往是效率杀手？
· 用 C# 插值字符串处理器写一个 sscanf
· Java 中堆内存和栈内存上的数据分布和特点
· 开发中对象命名的一点思考
· .NET Core内存结构体系(Windows环境)底层原理浅谈

阅读排行：
· 为什么说在企业级应用开发中，后端往往是效率杀手？
· 本地部署DeepSeek后，没有好看的交互界面怎么行！
· 趁着过年的时候手搓了一个低代码框架
· 推荐一个DeepSeek 大模型的免费 API 项目！兼容OpenAI接口！
· 用 C# 插值字符串处理器写一个 sscanf

公告

昵称：深夜十二点三十三
园龄： 6年7个月
粉丝： 13
关注： 0

<

2025年2月

>

日

一

二

三

四

五

六

26

27

28

29

30

31

1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

16

17

18

19

20

21

22

23

24

25

26

27

28

1

2

3

4

5

6

7

8

随笔分类

随笔档案

阅读排行榜

评论排行榜

1. 从二分类到多分类(3)

推荐排行榜

最新评论

1. Re:从二分类到多分类
@ jiaxinwei抱歉，这上个月忙着找工作看到晚了。这里是因为对于停用类（即编码为0），其汉明距离为0.5。汉明距离本身针对二元编码，这里应用在三元编码，实际是一种改进版本，出处来自Allwein...
--深夜十二点三十三
2. Re:从二分类到多分类
请问三元码测试示例与c2编码示例的海明距离怎么是2？
--jiaxinwei
3. Re:从二分类到多分类
请问三元码测试示例与c2编码示例怎么是2？
--jiaxinwei