PSPnet:Pyramid Scene Parsing Network——作者认为现有模型由于没有引入足够的上下文信息及不同感受野下的全局信息而存在分割出现错误的情景,于是,提出了使用global-scence-level的信息的pspnet

from:https://blog.csdn.net/bea_tree/article/details/56678560

首先声明,文末彩蛋,不是笔者提问的

1 一句话总结

作者认为现有模型由于没有引入足够的上下文信息及不同感受野下的全局信息而存在分割出现错误的情景,于是,提出了使用global-scence-level的信息的pspnet,另外本文提出了引入辅助loss的ResNet优化方法。

2 网络结构

本文提出的网络结构简单来说就是将DeepLab(不完全一样)aspp之前的feature map pooling了四种尺度之后 将5种feature map concat到一起经过卷积最后进行prediction的过程。
这里写图片描述

3 ResNet

本文除了网络之外,其ResNet的模型还是挺强的
这里写图片描述
这里写图片描述
如上图,首先作者在训练的时候加入了辅助loss,另外ResNet起始的7x7的卷积替换了三个3x3的卷积

4 实施细节

  • 使用了poly的学习策略,learning rate 0.01,power 0.9
  • momentum 0.9 weight decay 0.0001
  • random mirror
  • random resize [0.5,2]
  • random rotation [-10 degree,10 degree]
  • random gaussian blur
  • new caffe (batch size 16)
  • auxiliary loss weight to 0.4

5 Ablation study

作者通过实验,验证了文中各种设置的作用

5.1 psp net的作用(包括pooling的形式及数量)

这里写图片描述

5.2 auxiliary loss

这里写图片描述

5.3 pre-trained model

这里写图片描述

5.4 其他

这里写图片描述

6 知乎上的讨论

这里写图片描述

这里写图片描述

posted @   bonelee  阅读(6348)  评论(0编辑  收藏  举报
编辑推荐:
· 记一次.NET内存居高不下排查解决与启示
· 探究高空视频全景AR技术的实现原理
· 理解Rust引用及其生命周期标识(上)
· 浏览器原生「磁吸」效果!Anchor Positioning 锚点定位神器解析
· 没有源码,如何修改代码逻辑?
阅读排行:
· 全程不用写代码,我用AI程序员写了一个飞机大战
· MongoDB 8.0这个新功能碉堡了,比商业数据库还牛
· 记一次.NET内存居高不下排查解决与启示
· 白话解读 Dapr 1.15:你的「微服务管家」又秀新绝活了
· DeepSeek 开源周回顾「GitHub 热点速览」
点击右上角即可分享
微信分享提示