机器视觉-双向金字塔结构代码及文章

特征融合

特征融合通常是指将不同层次的feature map进行整合, 以便在检测head能利用不同尺寸的信息. 特征融合手段包括:

  1. concat 拼接
  2. FPN 特征金字塔网络
  3. BiFPN 双向特征金字塔网络
  4. SCP 结构单元: 这些结构单元通过卷积核归一化操作完成特征优化, 减少计算量
  5. 注意力机制(如CBAM和SE等), 注意力机制可以帮助模型关注更重要的特征区域, 从而提供特征融合的效果.

双向金字塔结构代码及文章

在yolo中引入双向金字塔结构, 使得特征融合时候更加关注小尺寸贡献的特征, 可以增强小目标检测能力, yaml文件改动非常简单, 只需要使用 BiFPN_Concat 替换原来的 Concat 即可.

posted @ 2024-02-19 21:22  harrychinese  阅读(88)  评论(0编辑  收藏  举报