摘要: Pyramid scene parsing network. In Proc. CVPR, pages 2881–2890, 2017 目的:扩大感受野,尽可能的利用全局上下文信息(某种程度上,可以认为感受野大小可以认为是对上下文信息利用的程度)。 做法: 1.对骨干提取的feature map(c 阅读全文
posted @ 2020-05-13 17:15 Parallax 阅读(2673) 评论(0) 推荐(0) 编辑
摘要: 一、RPN: 首先图片经过backbone抽取特征图 然后,RPN网络首先对特征图做一下卷积,比如3*3*256,对于特征图上每个像素点就得到(1,256)的长向量,分两支分别判断: 1.是不是物体(因为只是区域建议,只需要区分是前景还是背景) 2.若是物体(即认为此号anchor是Positive 阅读全文
posted @ 2020-05-13 10:50 Parallax 阅读(331) 评论(0) 推荐(0) 编辑