CBAM: Convolutional Block Attention Module

CBAM: Convolutional Block Attention Module

* Authors: [[Sanghyun Woo]], [[Jongchan Park]], [[Joon-Young Lee]], [[In So Kweon]]

doi:https://doi.org/10.48550/arXiv.1807.06521

初读印象

comment:: (CBAM)提出了卷积块注意力模块。沿着空间和通道推断注意力特征，然后将注意力特征乘到输入特征图上获得自适应特征细化。

Why

提升卷积性能的四个方向：

深度：LeNet、VGGNet、ResNet
广度：GoogLeNet
基数：Xception、ResNeXt
注意力：注意力不但能够告诉哪里应该注意，也增强了特征表示。本篇文章更加注重于用注意力增强特征表示：集中于重要的特征、压缩不必要的特征。其他注意力工作：Residual Attention Network，SEBlock([[@Hu2019]],通道间使用平均池化是次优特征，没有使用空间注意力)

What

提出了CBAM，为了能够获得通道和空间上的注意力，分别沿着两个方向做注意力（而非直接计算3D注意力，优点是计算量小）。

Pasted image 20220902151057 ###How

CBAM

Pasted image 20220902152849

CBAM依次推断1D通道注意力特征 $M_{C} (C \times 1 \times 1)$ 和2D空间注意力特征 $M_{S} (1 \times H \times W)$
Pasted image 20220902153059
其中 $⨂$ 为元素乘法（维度不同采用广播）。

通道注意力模块

利用通道间的关系生成通道注意力关系特征，通道注意力解决输入图像是“什么”的问题。

同时使用最大池化和平均池化分别产生 $F_{m a x}^{c}$ 和 $F_{m a x}^{c}$
$F_{m a x}^{c}$ 和 $F_{m a x}^{c}$ 分别经过含一个隐藏层的多层感知机（类似SEblock中，也是用了一个压缩系数r）。该感知机的参数是共享的，隐藏层中使用了ReLU。
元素级相加 $F_{m a x}^{c}$ 和 $F_{m a x}^{c}$ ，使用sigmoid。

空间注意力模块

使用特征间的空间关系生成空间注意力映射。空间注意力侧重于“哪里”。

分别沿着通道做最大池化和平均池化， $F_{m a x}^{s} (1 \times H \times W)$ 和 $F_{m a x}^{s} (1 \times H \times W)$ 。
拼接 $F_{m a x}^{s}$ 和 $F_{m a x}^{s}$ 。
7×7卷积并sigmoid。

Experiment

将CBAM嵌入到ResNet：
Pasted image 20220902162746 *注意力通道使用何种池化，一起用更好
Pasted image 20220902165227

空间注意力用什么池化
*
Grad-CAM可视化

Conclusion

同时使用了通道注意力和空间注意力，其中通道注意力和SE很像，能够适配其他网络。增加的计算量比较少，可以用于低端设备。

posted @ 2023-12-18 19:13 InunI 阅读(180) 评论(0) 编辑收藏举报

刷新页面返回顶部

登录后才能查看或发表评论，立即登录或者逛逛博客园首页

【推荐】还在用 ECharts 开发大屏？试试这款永久免费的开源 BI 工具！
【推荐】国内首个AI IDE，深度理解中文开发场景，立即下载体验Trae
【推荐】编程新体验，更懂你的AI，立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包，你的智能百科全书，全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell：AI 加持，快人一步

相关博文：

· Dual Attention Network for Scene Segmentation：双线并行的注意力

· Squeeze-and-Excitation Networks：SENet，早期cv中粗糙的注意力

· 《CBAM: Convolutional Block Attention Module》论文笔记

· 计算机视觉中的注意力，第 2 部分：CBAM 和 BAM

· CBAM注意力模型介绍

阅读排行：
· TypeScript + Deepseek 打造卜卦网站：技术与玄学的结合
· 阿里巴巴 QwQ-32B真的超越了 DeepSeek R-1吗？
· 【译】Visual Studio 中新的强大生产力特性
· 10年+ .NET Coder 心语 ── 封装的思维：从隐藏、稳定开始理解其本质意义
· 【设计模式】告别冗长if-else语句：使用策略模式优化代码结构

公告

昵称： InunI
园龄： 5年4个月
粉丝： 3
关注： 0

<

2025年3月

>

日

一

二

三

四

五

六

23

24

25

26

27

28

1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

16

17

18

19

20

21

22

23

24

25

26

27

28

29

30

31

1

2

3

4

5

随笔档案

阅读排行榜

评论排行榜

推荐排行榜

1. UIU-Net: U-Net in U-Net for Infrared Small Object Detection：Unet中的Unet(1)

最新评论

1. Re:UIU-Net: U-Net in U-Net for Infrared Small Object Detection：Unet中的Unet
@InunI 感谢楼主回复，我最近在魔改网络，UIUNet确实是个不错的网络！目前还没超过uiunet...
--爱通信的牛马
2. Re:UIU-Net: U-Net in U-Net for Infrared Small Object Detection：Unet中的Unet
@爱通信的牛马本质上是增多了参数量吧，但是因为特征图缩小了，在增多参数量的时候，复杂度增多的不多，在这种tradeoff下就增强了特征提取的能力。...
--InunI
3. Re:将博客搬至CSDN
地址？
--1900w
4. Re:UNetFormer: A UNet-like transformer for efficient semantic segmentation of remote sensing urban scene imagery
我在阅读UNetFormer 这篇论文，我请教一下为啥说加权和也就是点积会造成信息损失
--1900w
5. Re:UIU-Net: U-Net in U-Net for Infrared Small Object Detection：Unet中的Unet
这种大U里面加小U真的能够提升特征提取吗？
--爱通信的牛马