机器视觉-几篇小目标检测论文的解读
论文1
论文地址: https://www.mdpi.com/2227-9717/12/1/205
Research on an Intelligent Identification Method for Wind Turbine Blade Damage Based on CBAM-BiFPN-YOLOV8
Processes ( IF 3.5 ) Pub Date : 2024-01-18 , DOI: 10.3390/pr12010205
Hang Yu, Jianguo Wang, Yaxiong Han, Bin Fan, Chao Zhang
<<基于CBAM-BiFPN-YOLOV8的风电机组叶片损伤智能识别方法研究>>
为了解决风力涡轮机叶片损伤图像检测中复杂背景和多尺度特征分布的挑战,我们提出了一种基于增强型YOLOV8模型的方法。我们的方法侧重于三个关键方面:首先,我们通过将 CBAM 注意力机制集成到主干网络中来增强小目标特征的提取。其次,使用加权双向特征金字塔网络(BiFPN)代替路径聚合网络(PANet)来改进特征融合过程。这种修改优先考虑深层特征中的小目标特征,并促进多尺度特征的融合。最后,我们将损失函数从 CIoU 改进为 EIoU,增强对小目标的敏感性和边界框的抗扰动性,从而缩小计算预测与实际值之间的差距。实验结果表明,与YOLOV8模型相比,CBAM-BiFPN-YOLOV8模型在准确率、召回率、mAP@0.5、mAP@0.5:.95方面分别提高了1.6%、1.0%、1.4%和1.1%。 , 分别。该增强模型全面实现了显着的性能改进,以较低的计算成本证明了我们提出的增强功能的可行性和有效性。
更新日期:2024-01-20
解读:
从文章看可以看出, 引入双向特征金字塔网络(BiFPN)和 CBAM 注意力机制, 能改善小目标检测的效果, 按照下面文章讲, CBAM是一个空间和通道相结合的注意力实现, BiFPN 可改善特征融合的效果,
万字长文解析cv中的注意力机制: https://mp.weixin.qq.com/s/kt3iIuOD3lsZBTIbOSGN0g
论文2:
SF-YOLOv5: Improved YOLOv5 with swin transformer and fusion-concat method for multi-UAV detection
https://journals.sagepub.com/doi/10.1177/00202940231164126
代码参考: https://blog.csdn.net/weixin_51692073/article/details/132724315
https://blog.csdn.net/weixin_45303602/article/details/133216041
文章提出使用 swin transformer + fusion-concat 进行无人机检测, 效果看起来也很不错. 但Transformer 需要更大的算力,