机器视觉-双向金字塔结构代码及文章
特征融合
特征融合通常是指将不同层次的feature map进行整合, 以便在检测head能利用不同尺寸的信息. 特征融合手段包括:
- concat 拼接
- FPN 特征金字塔网络
- BiFPN 双向特征金字塔网络
- SCP 结构单元: 这些结构单元通过卷积核归一化操作完成特征优化, 减少计算量
- 注意力机制(如CBAM和SE等), 注意力机制可以帮助模型关注更重要的特征区域, 从而提供特征融合的效果.
双向金字塔结构代码及文章
- YOLOv8主干网络改进 添加加权双向金字塔结构的特征加强模块BiFPN https://zhuanlan.zhihu.com/p/674887344,支持2和3个input的合并.
- YOLOv8改进-bifpn: https://blog.csdn.net/weixin_45303602/article/details/132135514, 支持2和3个input的合并.
- YOLOv8最新改进系列:YOLOv8融合BiFPN网络,亲测显著涨点! https://blog.csdn.net/weixin_51692073/article/details/132594602, 仅支持2个input的合并.
在yolo中引入双向金字塔结构, 使得特征融合时候更加关注小尺寸贡献的特征, 可以增强小目标检测能力, yaml文件改动非常简单, 只需要使用 BiFPN_Concat 替换原来的 Concat 即可.