魔改工程师 - 博客园

2026年3月16日

YOLO11 改进 - 主干网络_ SwinTransformer 移位窗口层次化视觉变换器：层次化特征提取增强多尺度目标感知，优化复杂场景检测

摘要：本文介绍了Swin Transformer在YOLOv11中的结合，Swin Transformer是一种新型视觉Transformer，可作为计算机视觉通用骨干网络。它通过分层Transformer和移位窗口方案，解决了将Transformer应用于视觉领域时的尺度变化和高分辨率挑战，具有高效性和多尺度建模能力。其创新点包括类似CNN的层次化构建和局部自注意力计算。我们将Swin Transfo 阅读全文

posted @ 2026-03-16 21:19 魔改工程师阅读(6) 评论(0) 推荐(0)

YOLO11 改进 - 主干网络_ RevCol可逆列网络：轻量级多列设计破解特征信息丢失难题，提升小目标与密集目标感知精度

摘要：本文介绍了将可逆列网络（RevCol）与YOLOv11相结合的方法。RevCol由子网副本（列）组成，采用多级可逆连接，在前向传播时特征逐渐解耦且保留整体信息。该架构在图像分类、目标检测和语义分割等任务中表现出色，在多个数据集上取得优异成绩，还可引入到Transformer等网络中。我们将RevCol引入YOLOv11，对相关代码进行修改和注册，并配置了yolov11 \- RevCol\.yam 阅读全文

posted @ 2026-03-16 21:18 魔改工程师阅读(3) 评论(0) 推荐(0)

YOLO11 改进 - 主干网络_ RepViT重访移动端CNN的ViT视角：轻量级设计分离Token与Channel混合器，优化移动端实时检测

摘要：本文介绍了将轻量级卷积神经网络RepViT与YOLOv11相结合的方法。RepViT通过引入轻量级视觉变换器的高效架构设计，提升了移动设备上的计算机视觉任务性能。其采用结构重参数化技术，核心模块RepViT Block分离Token Mixer和Channel Mixer，有效处理空间和通道信息。我们将RepViT引入YOLOv11，对相关代码进行修改和注册，并配置了yolov11 \- RepV 阅读全文

posted @ 2026-03-16 21:16 魔改工程师阅读(4) 评论(0) 推荐(0)

YOLO11 改进 - 主干网络_ MobileNetV4 移动网络第四版：通用倒瓶颈与移动注意力协同优化硬件效率，提升移动端检测适应性

摘要：本文介绍了新型部分卷积（PConv）和基于其的FasterNet神经网络家族在YOLOv11中的结合应用。为解决神经网络浮点运算效率低下、内存访问频繁的问题，提出PConv，它能同时减少冗余计算和内存访问，高效提取空间特征。在此基础上构建的FasterNet家族，在多种设备上实现了更快的运行速度，且不牺牲视觉任务的准确性。我们将FasterNet集成进YOLOv11，通过相关代码修改与配置，经实验阅读全文

posted @ 2026-03-16 21:15 魔改工程师阅读(15) 评论(0) 推荐(0)

YOLO11 改进 - 主干网络_ LSKNet大型选择性核网络：大核深度卷积与空间选择机制协同动态调整感受野，增强旋转目标检测

摘要：本文介绍了将大型选择性核网络（LSKNet）与YOLOv11相结合的方法。LSKNet引入了LSKblock Attention注意力机制，能动态调整感受野，适应不同目标的上下文特征。该网络由LSK module、LSK Block等组成，通过解耦大核卷积和空间选择机制，有效处理不同目标的广泛上下文。我们将LSKNet引入YOLOv11，对相关代码进行修改和注册，并配置了yolov11 \- LS 阅读全文

posted @ 2026-03-16 21:13 魔改工程师阅读(9) 评论(0) 推荐(0)

YOLO11 改进 - 主干网络_ FasterNet (基于PConv部分卷积的神经网络)：轻量级设计优化内存访问效率，实现精度与速度双重提升

摘要：本文提出了将新型的部分卷积（PConv）和基于此的FasterNet神经网络家族与YOLOv11相结合。PConv通过减少冗余计算和内存访问，更高效地提取空间特征。FasterNet在各种设备上运行速度更快，且不牺牲视觉任务准确性。我们将FasterNet集成进YOLOv11，替换原有的骨干网络。实验表明，结合后的模型在相关数据集上进行训练，展示了FasterNet在提升YOLOv11运行速度方面阅读全文

posted @ 2026-03-16 21:11 魔改工程师阅读(4) 评论(0) 推荐(0)

YOLO11 改进 - 主干网络_ EfficientViT 高效视觉Transformer：硬件感知架构平衡全局感受野与局部细节，提升模型适应性

摘要：本文介绍了高速度视觉变换器EfficientViT在YOLOv11中的结合应用。现有视觉变换器计算成本高，不适合实时应用，EfficientViT通过采用夹心布局的内存高效模块和级联组注意力操作，减少了多头自注意力中的计算冗余，提高了内存效率和通道间通信。我们将EfficientViT集成进YOLOv11，通过一系列代码修改与配置，经实验验证取得了一定的效果，在速度和准确性之间达成了较好的平衡。阅读全文

posted @ 2026-03-16 21:09 魔改工程师阅读(7) 评论(0) 推荐(0)

YOLO11 改进 - 主干网络_ EfficientRep：一种旨在提高硬件效率的RepVGG风格卷积神经网络架构

摘要：本文介绍了EfficientRep卷积神经网络架构及其核心模块在YOLOv11中的结合应用。为解决传统神经网络效率评估指标对硬件不敏感问题，提出设计硬件感知神经网络的方法，构建EfficientRep架构。该架构采用RepVGG风格卷积结构，训练时结合多分支确保准确性，推理时转换为单分支。我们将EfficientRep的RepVGGBlock和RepBlock集成进YOLOv11，实验表明，其在单阅读全文

posted @ 2026-03-16 21:06 魔改工程师阅读(22) 评论(0) 推荐(0)

YOLO11 改进 - 主干网络_ ConvNeXtV2全卷积掩码自编码器网络：轻量级纯卷积架构破解特征坍塌难题，提升特征多样性

摘要：本文介绍了将ConvNeXt V2与YOLOv11相结合的方法。先前的ConvNeXt模型与自监督学习结合效果不佳，为此提出全卷积掩码自动编码器框架和全局响应归一化（GRN）层，形成ConvNeXt V2模型家族，显著提升了纯卷积神经网络在各类识别基准上的性能。我们将ConvNeXt V2引入YOLOv11，对相关代码进行了修改和注册，并配置了yolov11 \- ConvNeXtV2\.yaml 阅读全文

posted @ 2026-03-16 21:04 魔改工程师阅读(5) 评论(0) 推荐(0)

YOLO11 改进 - 主干网络集成Mamba-YOLO（AAAI 2025），Mamba-YOLO11-T 替换骨干，破解全局依赖建模难题，实现高效实时检测

摘要： # 前言本文介绍Mamba YOLO，为图片物体识别提供了“又快又准”的新方案。传统CNN架构运行快但难以捕捉远距离关联物体，Transformer架构精度高但计算量呈平方级增长，而SSM虽计算量为线性级且能抓全局关联，但用于图片识别时细节定位不准。为此，Mamba YOLO做了三项关键优化：引入ODMamba骨干网络，解决自注意力的二次复杂度问题，且无需预训练；设计ODMamba宏观结构确阅读全文

posted @ 2026-03-16 21:01 魔改工程师阅读(29) 评论(0) 推荐(0)

YOLOv8创新改进

公告