机器视觉-双向金字塔结构代码及文章

特征融合

特征融合通常是指将不同层次的feature map进行整合, 以便在检测head能利用不同尺寸的信息. 特征融合手段包括:

concat 拼接
FPN 特征金字塔网络
BiFPN 双向特征金字塔网络
SCP 结构单元: 这些结构单元通过卷积核归一化操作完成特征优化, 减少计算量
注意力机制(如CBAM和SE等), 注意力机制可以帮助模型关注更重要的特征区域, 从而提供特征融合的效果.

双向金字塔结构代码及文章

YOLOv8主干网络改进添加加权双向金字塔结构的特征加强模块BiFPN https://zhuanlan.zhihu.com/p/674887344,支持2和3个input的合并.
YOLOv8改进-bifpn: https://blog.csdn.net/weixin_45303602/article/details/132135514, 支持2和3个input的合并.
YOLOv8最新改进系列：YOLOv8融合BiFPN网络，亲测显著涨点！ https://blog.csdn.net/weixin_51692073/article/details/132594602, 仅支持2个input的合并.

在yolo中引入双向金字塔结构, 使得特征融合时候更加关注小尺寸贡献的特征, 可以增强小目标检测能力, yaml文件改动非常简单, 只需要使用 BiFPN_Concat 替换原来的 Concat 即可.

posted @ 2024-02-19 21:22 harrychinese 阅读(88) 评论(0) 编辑收藏举报

刷新页面返回顶部