YOLOv5-7.0 后处理解析

问题1：怎么算输出的维度？

方法1：我们可以直接导出 pt 为 onnx 文件，使用 Netron 来看即可。

 python export.py --weights yolov5s.pt --include  onnx --simplify
# --simplify 帮助我们看每个维度是多少。

方法2：手工计算

假设输入是 640*480( w, h )。假设有 3个 head，最大下采样为 32 倍，那么 640/32 = 20, 480/32 = 15, 85 为 (x,y,w,h,confidence, 80个类)。

所以，最后的特征图降为 20*15, 40*30, 80*60。 3 表示每个特征图上的点有 3 个 anchor，那么就有 3 个预测框。

如果 batchsize=1，那么输出就有：

1*3*20*15*85， 1*3*40*30*85， 1*3*80*60*85
-> 1*900*85, 1*3600*85, 1*14400*85,

我们在维度1 Concat 后为 1*18900*85。

问题：为什么可以直接 Concat？

因为：这些框已经还原为原图的坐标上面了。模型本来输出的 tx,ty,tw,th 已经变为了输入图像坐标下的 bx,by,bw,bh 了。因此后面直接对该结果 1*18900*85（bx,by,bw,bh）做 NMS 即可得到最后的检测结果。

后处理：

【1】https://blog.csdn.net/zhuguiqin1/article/details/122739044

【2】https://flyfish.blog.csdn.net/article/details/127265913

【3】https://flyfish.blog.csdn.net/article/details/119177472

【4】https://blog.csdn.net/lzzzzzzm/article/details/120151155

posted @ 2023-06-02 18:16 Zenith_Hugh 阅读(1829) 评论(0) 编辑收藏举报

刷新页面返回顶部

登录后才能查看或发表评论，立即登录或者逛逛博客园首页

相关博文：

· YOLOv7：第一篇之实践和推理

· YOLOv5的 detect.py 参数解读

· yolov5输出解码实现

· YOLOv5的输出端head头代码解读

· torch导出onnx示例-yolo

阅读排行：
· 阿里最新开源QwQ-32B，效果媲美deepseek-r1满血版，部署成本又又又降低了！
· 单线程的Redis速度为什么快？
· SQL Server 2025 AI相关能力初探
· AI编程工具终极对决：字节Trae VS Cursor，谁才是开发者新宠？
· 展开说说关于C#中ORM框架的用法！

公告

昵称： Zenith
园龄： 4年7个月
粉丝： 49000
关注： 12

+加关注

闲情偶得

不知江月待何人，但见长江送流水。

【唐代】张若虚

《春江花月夜》

2025年3月

日

一

二

三

四

五

六

Zenith Hugh

知行合一

YOLOv5-7.0 后处理解析

问题1：怎么算输出的维度？

公告

闲情偶得

搜索

常用链接

最新随笔

我的标签

积分与排名

合集 (5)

随笔分类 (270)

随笔档案 (260)

相册 (12)

AI

docker 镜像

机器人相关

论文阅读

数学科普

音乐和视频

杂志

资源网站

阅读排行榜

评论排行榜

推荐排行榜

最新评论

喜欢请打赏

	python export.py --weights yolov5s.pt --include onnx --simplify
	# --simplify 帮助我们看每个维度是多少。

Zenith Hugh

知行合一

YOLOv5-7.0 后处理 解析

问题1： 怎么算输出的维度？

公告

闲情偶得

搜索

常用链接

最新随笔

我的标签

积分与排名

合集 (5)

随笔分类 (270)

随笔档案 (260)

相册 (12)

AI

docker 镜像

机器人相关

论文阅读

数学科普

音乐和视频

杂志

资源网站

阅读排行榜

评论排行榜

推荐排行榜

最新评论

喜欢请打赏

YOLOv5-7.0 后处理解析

问题1：怎么算输出的维度？