摘要:
本文介绍了Swin Transformer在YOLOv11中的结合,Swin Transformer是一种新型视觉Transformer,可作为计算机视觉通用骨干网络。它通过分层Transformer和移位窗口方案,解决了将Transformer应用于视觉领域时的尺度变化和高分辨率挑战,具有高效性和多尺度建模能力。其创新点包括类似CNN的层次化构建和局部自注意力计算。我们将Swin Transfo 阅读全文
posted @ 2026-03-16 21:19
魔改工程师
阅读(6)
评论(0)
推荐(0)
摘要:
本文介绍了将可逆列网络(RevCol)与YOLOv11相结合的方法。RevCol由子网副本(列)组成,采用多级可逆连接,在前向传播时特征逐渐解耦且保留整体信息。该架构在图像分类、目标检测和语义分割等任务中表现出色,在多个数据集上取得优异成绩,还可引入到Transformer等网络中。我们将RevCol引入YOLOv11,对相关代码进行修改和注册,并配置了yolov11 \- RevCol\.yam 阅读全文
posted @ 2026-03-16 21:18
魔改工程师
阅读(3)
评论(0)
推荐(0)
摘要:
本文介绍了将轻量级卷积神经网络RepViT与YOLOv11相结合的方法。RepViT通过引入轻量级视觉变换器的高效架构设计,提升了移动设备上的计算机视觉任务性能。其采用结构重参数化技术,核心模块RepViT Block分离Token Mixer和Channel Mixer,有效处理空间和通道信息。我们将RepViT引入YOLOv11,对相关代码进行修改和注册,并配置了yolov11 \- RepV 阅读全文
posted @ 2026-03-16 21:16
魔改工程师
阅读(4)
评论(0)
推荐(0)
摘要:
本文介绍了新型部分卷积(PConv)和基于其的FasterNet神经网络家族在YOLOv11中的结合应用。为解决神经网络浮点运算效率低下、内存访问频繁的问题,提出PConv,它能同时减少冗余计算和内存访问,高效提取空间特征。在此基础上构建的FasterNet家族,在多种设备上实现了更快的运行速度,且不牺牲视觉任务的准确性。我们将FasterNet集成进YOLOv11,通过相关代码修改与配置,经实验 阅读全文
posted @ 2026-03-16 21:15
魔改工程师
阅读(15)
评论(0)
推荐(0)
摘要:
本文介绍了将大型选择性核网络(LSKNet)与YOLOv11相结合的方法。LSKNet引入了LSKblock Attention注意力机制,能动态调整感受野,适应不同目标的上下文特征。该网络由LSK module、LSK Block等组成,通过解耦大核卷积和空间选择机制,有效处理不同目标的广泛上下文。我们将LSKNet引入YOLOv11,对相关代码进行修改和注册,并配置了yolov11 \- LS 阅读全文
posted @ 2026-03-16 21:13
魔改工程师
阅读(9)
评论(0)
推荐(0)
摘要:
本文提出了将新型的部分卷积(PConv)和基于此的FasterNet神经网络家族与YOLOv11相结合。PConv通过减少冗余计算和内存访问,更高效地提取空间特征。FasterNet在各种设备上运行速度更快,且不牺牲视觉任务准确性。我们将FasterNet集成进YOLOv11,替换原有的骨干网络。实验表明,结合后的模型在相关数据集上进行训练,展示了FasterNet在提升YOLOv11运行速度方面 阅读全文
posted @ 2026-03-16 21:11
魔改工程师
阅读(4)
评论(0)
推荐(0)
摘要:
本文介绍了高速度视觉变换器EfficientViT在YOLOv11中的结合应用。现有视觉变换器计算成本高,不适合实时应用,EfficientViT通过采用夹心布局的内存高效模块和级联组注意力操作,减少了多头自注意力中的计算冗余,提高了内存效率和通道间通信。我们将EfficientViT集成进YOLOv11,通过一系列代码修改与配置,经实验验证取得了一定的效果,在速度和准确性之间达成了较好的平衡。 阅读全文
posted @ 2026-03-16 21:09
魔改工程师
阅读(7)
评论(0)
推荐(0)
摘要:
本文介绍了EfficientRep卷积神经网络架构及其核心模块在YOLOv11中的结合应用。为解决传统神经网络效率评估指标对硬件不敏感问题,提出设计硬件感知神经网络的方法,构建EfficientRep架构。该架构采用RepVGG风格卷积结构,训练时结合多分支确保准确性,推理时转换为单分支。我们将EfficientRep的RepVGGBlock和RepBlock集成进YOLOv11,实验表明,其在单 阅读全文
posted @ 2026-03-16 21:06
魔改工程师
阅读(22)
评论(0)
推荐(0)
摘要:
本文介绍了将ConvNeXt V2与YOLOv11相结合的方法。先前的ConvNeXt模型与自监督学习结合效果不佳,为此提出全卷积掩码自动编码器框架和全局响应归一化(GRN)层,形成ConvNeXt V2模型家族,显著提升了纯卷积神经网络在各类识别基准上的性能。我们将ConvNeXt V2引入YOLOv11,对相关代码进行了修改和注册,并配置了yolov11 \- ConvNeXtV2\.yaml 阅读全文
posted @ 2026-03-16 21:04
魔改工程师
阅读(5)
评论(0)
推荐(0)
摘要:
# 前言 本文介绍Mamba YOLO,为图片物体识别提供了“又快又准”的新方案。传统CNN架构运行快但难以捕捉远距离关联物体,Transformer架构精度高但计算量呈平方级增长,而SSM虽计算量为线性级且能抓全局关联,但用于图片识别时细节定位不准。为此,Mamba YOLO做了三项关键优化:引入ODMamba骨干网络,解决自注意力的二次复杂度问题,且无需预训练;设计ODMamba宏观结构确 阅读全文
posted @ 2026-03-16 21:01
魔改工程师
阅读(29)
评论(0)
推荐(0)

浙公网安备 33010602011771号