【目标检测】YOLO v5 打电话手机目标检测模型
YOLO v5 打电话手机目标检测模型:计算机配置、制作数据集、训练、结果分析和使用
前言
YOLO v5模型简单易上手好用,电话/手机图片检测、视频检测及场地摄像头实时监测。
YOLO v5 优点:
- 可识别视频帧数高。
- 技术成熟,有现成模型和操作界面。
- 操作简单。
打电话/手机行为识别:
- 实时监测。
- 离线监测。
- 毕设需求。
- 项目落地。
打电话/手机目标检测痛难点:
- 形状:手机小,在图像中所占比例小,难捕捉。
- 接打电话,异常难捕捉。
- 手机数据集:目前网上没有现成的已label好的手机数据集,需自己手动标注。
所以需要收集并制作大量的手机图片数据集,同时选择合适的算法模型,以提高目标检测准确率。
相关连接(待续)
(1)本文视频教程:https://www.bilibili.com/video/BV1S5411Q7Zi/
(2)JSON文件转换成YOLO标注格式txt的python脚本:https://item.taobao.com/item.htm?ft=t&id=679809896516
(3)打电话/手机检测项目YOLO格式数据集7851张图片:https://item.taobao.com/item.htm?ft=t&id=680794459408
(4)YOLO v5 打电话.手机行为识别检测项目模型代码、模型权重及Windows界面:https://item.taobao.com/item.htm?ft=t&id=680787091403
一、计算机配置
pytorch安装-GPU版本
pytorch有gpu版本和cpu版本,图片识别最好(必须)使用GPU版本,前提是电脑有GPU。GPU版本安装的具体步骤可以参考这篇文章:GPU版本安装。
pycocotools的安装
pip install pycocotools-windows
二、YOLO v5下载
YOLO v5模型官网,有具体的使用说明和介绍。视频识别帧数杠杠的!但这官网YOLO v5 包没有设计Windows界面。
目前官网YOLO v5 包里训练模型主要有v5s、v5m、v5l、v5x,对GPU要求依次增加,其中v5x对GPU要求异常高。
三、模型使用
获取数据集
首先写个python脚本将JSON文件中的标注信息转换成YOLO格式(即TXT标注信息)。制作好的电话数据集YOLO格式数据集文件如图所示。
images文件包括train、test和val三个文件。
images文件里的分类和数量必须和labels文件相对应。如有需要吸烟检测项目YOLO格式数据集可直接下载,该数据集有6400+张图片。
更改train.py文件
train.py文件修改部分如下图,修改的参数很少,简单易上手,对小白很友好。
本文使用的是YOLO v5s配置文件,预训练模型也是YOLO v5s模型,使用GPU计算,迭代次数为50,训练时间很长,很辛苦!若更改迭代次数为100或更改为更大的模型,训练耗时更长!
应广大网友需求也训练了YOLO v5m和和YOLO v5l的模型权重。
模型权重
使用GPU训练模型,训练几十个小时。结果迭代过程损失如图,可以看出,训练结果还是很好的,mAP值可达0.7以上。
四、吸烟视频检测效果
目标检测YOLOv5手机/电话检测视频检测
直接使用上述YOLO v5s 模型权重,载入Windows界面代码,对吸烟视频进行识别检测,效果还是很好的,手机/电话检测置信度稳定在0.75!也可以连接摄像头实时监测!
总结
基于YOLO v5 模型,手机/电话目标检测亲测效果好!
相关代码、数据集和模型,如有需要请联系,亦可远程指导。
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· winform 绘制太阳,地球,月球 运作规律
· AI与.NET技术实操系列(五):向量存储与相似性搜索在 .NET 中的实现
· 超详细:普通电脑也行Windows部署deepseek R1训练数据并当服务器共享给他人
· 【硬核科普】Trae如何「偷看」你的代码?零基础破解AI编程运行原理
· 上周热点回顾(3.3-3.9)