随笔分类 - 目标检测
摘要:You Only Look Once: Unified, Real-Time Object Detection yolov1结构图,除了第一个 7*7 卷积(pad=3)外,其他卷积的 (pad=1)。 问题1:Unified 指的是什么? Unified 指的是 单个神经网络架构,用一个模型输出得
阅读全文
摘要:1. 模型研究 通过导出的 onnx,我们就可以研究下模型结构。 首先看下模型概览: 值得注意的是: 输出的维度变为:[1, 84, 8400], 至于 为什么是 84 和 8400 后面有答案。 1. yolov5 和 yolov8 对比( 通过 yaml ) 对照 yolov8.yaml 文件
阅读全文
摘要:#### 问题1: 怎么算输出的维度? 方法1:我们可以直接导出 pt 为 onnx 文件,使用 Netron 来看即可。 python export.py --weights yolov5s.pt --include onnx --simplify # --simplify 帮助我们看每个维度是多
阅读全文
摘要:| 原始题目 | SSD: Single Shot MultiBox Detector | | | | | 中文名称 | SSD: 一阶段 多框 检测器 | | 发表时间 | 2015年12月8日 | | 平台 | ECCV 2016 | | 来源 | 北卡罗来纳大学教堂山分校 | | 文章链接 |
阅读全文
摘要:| 原始题目 | SSH: Single Stage Headless Face Detector | | | | | 中文名称 | SSH: 单阶段 无头的 人脸检测器 | | 发表时间 | 2017年8月14日 | | 平台 | ICCV 2017 | | 来源 | University of
阅读全文
摘要:| 原始题目 | Joint Face Detection and Alignment using Multi-task Cascaded Convolutional Networks | | | | | 中文名称 | 基于 多任务级联卷积网络 的 联合 人脸检测与对齐 | | 发表时间 | 201
阅读全文
摘要:| 原始题目 | Sample and Computation Redistribution for Efficient Face Detection | | | | | 中文名称 | 采样和计算 重分配的 高效人脸检测 | | 发表时间 | 2021年5月10日 | | 平台 | ICLR-202
阅读全文
摘要:简介 YOLOv8模型设计快速,准确,易于使用,使其成为广泛的目标检测和图像分割任务的绝佳选择。 The YOLOv8 model is designed to be fast, accurate, and easy to use, making it an excellent choice for
阅读全文
摘要:目标检测目前最困难的事情: 漏检:无法把前景检测出来,个人认为,最简单的加数据解决 误检:把背景检测为前景,也叫 开放域识别问题。非常困难的事情。有人基于度量学习解决。主要的问题是:收集的数据在一个封闭域,但是模型的部署需要到开放世界,就容易出现该问题。有人说,深度学习是学习的纹理,经过测试对于差不
阅读全文
摘要:本文定义的类别不平衡问题:在图像分类问题中,不同类别的图像的个数不同,并且差异较大。在目标检测问题中,目标类别的个数区别较大。这都是类别不平衡问题。 原理: 当训练图像的所有 类个数不相同 时, 我们可以更改 类权重 , 即而达到更改 图像权重 的目的。然后根据 图像权重 重新采集数据,这在图像类别
阅读全文
摘要:笔记来源:https://www.bilibili.com/video/BV1jo4y1D7CF/?vd_source=2ed6e8af02f9ba8cb90b90e99bd4ccee 近年来,目标检测的工程应用研究中,YOLO系列以快速响应、高精度、结构简单以及容易部署的特点备受工程研究人员的青睐
阅读全文
摘要:参考链接: https://blog.csdn.net/weixin_43745234/article/details/121561217 YOLOv5 与 YOLOv7 输出的混淆矩阵,其中每一列表示该列的真实标签,被分类到其他类的概率,这里进行了归一化。Recall 定义是:所有真实 Posit
阅读全文
摘要:Retinaface 是一个人脸检测器,人脸检测天生存在强先验知识,比如近场人脸识别,人脸较大,监控视角下人脸识别通常人脸较小,两者天生对输入的分辨率有个假设,如果人脸很大,不需要大的分辨率,提升速度。人脸小,希望提高 Recall 那么需要大的分辨率。Retinaface 在不同分辨率下怎么做这件
阅读全文
摘要:我认为单类训练主要是用来区分前景和背景。 实际做的时候:加一个参数就行 --single-cls nohup python -m torch.distributed.launch --nproc_per_node 2 --master_port 9527 train.py --workers 16
阅读全文
摘要:数据集官方网址: WIDER FACE: A Face Detection Benchmark 本文所用的开源代码:https://github.com/biubug6/Pytorch_Retinaface 数据集介绍 WIDER FACE 数据集是一个人脸检测基准数据集,其中图像选自公开可用的WI
阅读全文
摘要:### 1. 多GPU后台分布式训练: # 后台从头训练 不要忘记 & 后面加上&符号,可以使得我们就算关掉了session连接,远程服务器也可以保持训练任务的运行。 nohup python -m torch.distributed.launch --nproc_per_node 2 --mast
阅读全文
摘要:YOLOX 资源 https://www.zhihu.com/question/473350307 YOLOv7 | 模型结构与正负样本分配解析 https://blog.csdn.net/weixin_44751294/article/details/125303278?spm=1001.2014
阅读全文
摘要:1. YOLOv7 代码组织结构 YOLOv7 代码结构 . ├── cfg(存放`yaml`格式定义的网络结构) │ ├── baseline(用来比较的) │ │ ├── r50-csp.yaml │ │ ├── x50-csp.yaml │ │ ├── yolor-csp-x.yaml │ │
阅读全文
摘要:之前我一直使用 VOC 格式的数据来训练 YOLO, 这次整理下 COCO 格式的数据。 当我们在COCO 官网下载数据后,是以下格式: . ├── annotations | ├── captions_train2017.json | ├── captions_val2017.json | ├──
阅读全文