YOLOV5 配置文件

模型配置

 anchors = [[(10, 13), (16, 30), (33, 23)], # 多尺度的先验框基本尺寸,(在三个尺度的特征图上放置anchors)
           [(30, 61), (62, 45), (59, 119)],
           [(116, 90), (156, 198), (373, 326)]]
strides = [8, 16, 32] # 先验框生成器的步幅
 
model = dict(
    type='YOLODetector', #检测器名
    data_preprocessor=dict(  # 数据预处理器的配置，通常包括图像归一化和 padding
        type='mmdet.DetDataPreprocessor',  # 数据预处理器的类型，还可以选择 'YOLOv5DetDataPreprocessor' 训练速度更快
        mean=[0., 0., 0.],  # 用于预训练骨干网络的图像归一化通道均值，按 R、G、B 排序
        std=[255., 255., 255.], # 用于预训练骨干网络的图像归一化通道标准差，按 R、G、B 排序
        bgr_to_rgb=True),  # 是否将图像通道从 BGR 转为 RGB
    backbone=dict(  # 主干网络的配置文件
        type='YOLOv5CSPDarknet',  # 主干网络的类别，目前可选用 'YOLOv5CSPDarknet', 'YOLOv6EfficientRep', 'YOLOXCSPDarknet' 3种
        deepen_factor=deepen_factor, # 控制网络结构深度的缩放因子
        widen_factor=widen_factor, # 控制网络结构宽度的缩放因子
        norm_cfg=dict(type='BN', momentum=0.03, eps=0.001), # 归一化层(norm layer)的配置项
        act_cfg=dict(type='SiLU', inplace=True)), # 激活函数(activation function)的配置项
    neck=dict(
        type='YOLOv5PAFPN',  # 检测器的 neck 是 YOLOv5FPN，我们同样支持 'YOLOv6RepPAFPN', 'YOLOXPAFPN'
        deepen_factor=deepen_factor, # 控制网络结构深度的缩放因子
        widen_factor=widen_factor, # 控制网络结构宽度的缩放因子
        in_channels=[256, 512, 1024], # 输入通道数，与 Backbone 的输出通道一致
        out_channels=[256, 512, 1024], # 输出通道数，与 Head 的输入通道一致
        num_csp_blocks=3, # CSPLayer 中 bottlenecks 的数量
        norm_cfg=dict(type='BN', momentum=0.03, eps=0.001), # 归一化层(norm layer)的配置项
        act_cfg=dict(type='SiLU', inplace=True)), # 激活函数(activation function)的配置项
    bbox_head=dict(
        type='YOLOv5Head', # bbox_head 的类型是 'YOLOv5Head', 我们目前也支持 'YOLOv6Head', 'YOLOXHead'
        head_module=dict(
            type='YOLOv5HeadModule', # head_module 的类型是 'YOLOv5HeadModule', 我们目前也支持 'YOLOv6HeadModule', 'YOLOXHeadModule'
            num_classes=80, # 分类的类别数量
            in_channels=[256, 512, 1024], # 输入通道数，与 Neck 的输出通道一致
            widen_factor=widen_factor, # 控制网络结构宽度的缩放因子
            featmap_strides=[8, 16, 32], # 多尺度特征图的步幅
            num_base_priors=3), # 在一个点上，先验框的数量
        prior_generator=dict( # 先验框(prior)生成器的配置
            type='mmdet.YOLOAnchorGenerator', # 先验框生成器的类型是 mmdet 中的 'YOLOAnchorGenerator'
            base_sizes=anchors, # 多尺度的先验框基本尺寸
            strides=strides), # 先验框生成器的步幅, 与 FPN 特征步幅一致。如果未设置 base_sizes，则当前步幅值将被视为 base_sizes。
    ),
    test_cfg=dict(
        multi_label=True, # 对于多类别预测来说是否考虑多标签，默认设置为 True
        nms_pre=30000,  # NMS 前保留的最大检测框数目
        score_thr=0.001, # 过滤类别的分值，低于 score_thr 的检测框当做背景处理
        nms=dict(type='nms', # NMS 的类型
                 iou_threshold=0.65), # NMS 的阈值
        max_per_img=300)) # 每张图像 NMS 后保留的最大检测框数目

上一篇深度学习训练技巧(tircks)

下一篇01-输出"hello world"

本文作者：seekwhale13

本文链接：https://www.cnblogs.com/seekwhale13/p/18235175

posted @ 2024-06-06 15:02 seekwhale13 阅读(52) 评论(0) 编辑收藏举报

刷新页面返回顶部

登录后才能查看或发表评论，立即登录或者逛逛博客园首页

相关博文：

· 论文阅读-Learning to Predict Visual Attributes in the Wild

· 论文阅读-CORA: Adapting CLIP for Open-Vocabulary Detection with Region Prompting and Anchor Pre-Matching

· YOLO-V5-超参数介绍及优化策略

· 模型配置介绍 yolov5s.yaml

· Y3、yolov5s.yaml文件解读

阅读排行：
· 25岁的心里话
· 闲置电脑爆改个人服务器（超详细） #公网映射 #Vmware虚拟网络编辑器
· 零经验选手，Compose 一天开发一款小游戏！
· 通过 API 将Deepseek响应流式内容输出到前端
· 因为Apifox不支持离线，我果断选择了Apipost！

seekwhale13

YOLOV5 配置文件

模型配置

公告

最新随笔

随笔分类

最新评论

	anchors = [[(10, 13), (16, 30), (33, 23)], # 多尺度的先验框基本尺寸,(在三个尺度的特征图上放置anchors)
	[(30, 61), (62, 45), (59, 119)],
	[(116, 90), (156, 198), (373, 326)]]
	strides = [8, 16, 32] # 先验框生成器的步幅

	model = dict(
	type='YOLODetector', #检测器名
	data_preprocessor=dict( # 数据预处理器的配置，通常包括图像归一化和 padding
	type='mmdet.DetDataPreprocessor', # 数据预处理器的类型，还可以选择 'YOLOv5DetDataPreprocessor' 训练速度更快
	mean=[0., 0., 0.], # 用于预训练骨干网络的图像归一化通道均值，按 R、G、B 排序
	std=[255., 255., 255.], # 用于预训练骨干网络的图像归一化通道标准差，按 R、G、B 排序
	bgr_to_rgb=True), # 是否将图像通道从 BGR 转为 RGB
	backbone=dict( # 主干网络的配置文件
	type='YOLOv5CSPDarknet', # 主干网络的类别，目前可选用 'YOLOv5CSPDarknet', 'YOLOv6EfficientRep', 'YOLOXCSPDarknet' 3种
	deepen_factor=deepen_factor, # 控制网络结构深度的缩放因子
	widen_factor=widen_factor, # 控制网络结构宽度的缩放因子
	norm_cfg=dict(type='BN', momentum=0.03, eps=0.001), # 归一化层(norm layer)的配置项
	act_cfg=dict(type='SiLU', inplace=True)), # 激活函数(activation function)的配置项
	neck=dict(
	type='YOLOv5PAFPN', # 检测器的 neck 是 YOLOv5FPN，我们同样支持 'YOLOv6RepPAFPN', 'YOLOXPAFPN'
	deepen_factor=deepen_factor, # 控制网络结构深度的缩放因子
	widen_factor=widen_factor, # 控制网络结构宽度的缩放因子
	in_channels=[256, 512, 1024], # 输入通道数，与 Backbone 的输出通道一致
	out_channels=[256, 512, 1024], # 输出通道数，与 Head 的输入通道一致
	num_csp_blocks=3, # CSPLayer 中 bottlenecks 的数量
	norm_cfg=dict(type='BN', momentum=0.03, eps=0.001), # 归一化层(norm layer)的配置项
	act_cfg=dict(type='SiLU', inplace=True)), # 激活函数(activation function)的配置项
	bbox_head=dict(
	type='YOLOv5Head', # bbox_head 的类型是 'YOLOv5Head', 我们目前也支持 'YOLOv6Head', 'YOLOXHead'
	head_module=dict(
	type='YOLOv5HeadModule', # head_module 的类型是 'YOLOv5HeadModule', 我们目前也支持 'YOLOv6HeadModule', 'YOLOXHeadModule'
	num_classes=80, # 分类的类别数量
	in_channels=[256, 512, 1024], # 输入通道数，与 Neck 的输出通道一致
	widen_factor=widen_factor, # 控制网络结构宽度的缩放因子
	featmap_strides=[8, 16, 32], # 多尺度特征图的步幅
	num_base_priors=3), # 在一个点上，先验框的数量
	prior_generator=dict( # 先验框(prior)生成器的配置
	type='mmdet.YOLOAnchorGenerator', # 先验框生成器的类型是 mmdet 中的 'YOLOAnchorGenerator'
	base_sizes=anchors, # 多尺度的先验框基本尺寸
	strides=strides), # 先验框生成器的步幅, 与 FPN 特征步幅一致。如果未设置 base_sizes，则当前步幅值将被视为 base_sizes。
	),
	test_cfg=dict(
	multi_label=True, # 对于多类别预测来说是否考虑多标签，默认设置为 True
	nms_pre=30000, # NMS 前保留的最大检测框数目
	score_thr=0.001, # 过滤类别的分值，低于 score_thr 的检测框当做背景处理
	nms=dict(type='nms', # NMS 的类型
	iou_threshold=0.65), # NMS 的阈值
	max_per_img=300)) # 每张图像 NMS 后保留的最大检测框数目