DeepLab V3论文阅读笔记
DeepLab V3
这是2017年发表在CVPR上的文章。相比于V2而言,主要不同之处有三个:引入了Multi-grid、改进了ASPP结构、移除CRFs后处理。
解决多尺度问题的几种办法:
在DeepLab V3中作者提出了两种结构:cascaded model以及ASPP model:
DeepLabV3的几个模块与ResNet50的conv层相对应。
在cascaded模型中,其还增加了block5、6以及7,其与block4基本相同,只是采用了不同的膨胀系数。对于block3,只在训练的时候进行下采样,这样可以让训练时的batch size变大,同时可以加快推理速度。同时如果验证时仍然在block3下采样到16倍的话效果会差一些。现在可以直接下采样到8倍,因为设备的显存增大了。
对于ASPP model,主要看ASPP这个模块。
在V2的ASPP模块中每个空洞卷积后没有BN和ReLU,这四个分支上的输出相加之后就直接上采样还原到原图大小了。上图的膨胀系数翻倍的原因是作者在原论文中提到如果下采样到8倍的话膨胀系数需要翻倍。同时在全局池化层后需要用1*1卷积来调整channel。
multi-grid
ASPP model没有block567,因此对于cascaded model使用(1, 2, 1),对于ASPP model使用(1, 2, 4)。
训练细节:
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· 阿里最新开源QwQ-32B,效果媲美deepseek-r1满血版,部署成本又又又降低了!
· 单线程的Redis速度为什么快?
· SQL Server 2025 AI相关能力初探
· AI编程工具终极对决:字节Trae VS Cursor,谁才是开发者新宠?
· 展开说说关于C#中ORM框架的用法!
2020-04-03 洛谷P3128 [USACO15DEC]Max Flow P(树上点差分裸题)
2020-04-03 POJ3417 Network (树上差分)