20230210 组会学习

该方法主要是基于 Restormer 的改进，主要改进有以下三点

作者通过 Feature Mixing Block 获取图像的局部和非局部信息

作者观察到 Attention Maps 与 query 不相关，并且比较稀疏，从而提出将卷积和注意力结合的思想

作者认为现有的 CNN 方法重点在于加大深度和宽度，没有充分利用先验知识，并且对待雾的不均匀性，采用不平等的方法。于是作者提出了以下两点方案

改进的 U-Net 结构，降低了计算量

本次组会大多数内容是对 Transformer 结构的改进。主要有两个部分，一是对 Attention 的改进，二是对 FFN 的改进。

注意力部分的改进，大多数在于降低计算量和增加通道的信息。其中计算量对于高光谱的多模态融合方向很难考虑，增加通道的交互应该是借鉴的重点。
FFN 部分的改进大多比较容易直接应用，也可以借鉴到融合的交互中。
论文中也有许多 CNN 和注意力结合的工作，该部分的借鉴意义比较大。个人认为，CNN 的效果在高光谱的多模态融合方向要比注意力更具有优势，但由于缺乏全局的信息，可以考虑将注意力融入 CNN 的尝试。

posted @ 2023-02-13 18:11 logt 阅读(94) 评论(0) 编辑收藏举报

刷新页面返回顶部

logt