九天只能井盖隐患识别学习心得

基本思路：

前期处理：数据集的图片集一共1800多张，分成五个类别，因此可以采用目标检测算法或者分类算法，通过观察数据集发现五种图片子集之间的样本数量并不均衡，所以这很可能会影响后续的模型效果。

因此需要对数据集扩容，扩容操作可以利用Python的爬虫爬取对应标签的井盖图片，　使得原数据集样本数量扩充到1万张左右，并且要尽可能的不修改原图片子集的综合占比。

预处理：由于每种图片的规格不一样，所以我打算将图片归一到同一长宽比例，图片是三通道，每种通道强度在0-255，因此在归一化的处理时采用除以255的操作将图片转化为0-1并且重新reshape，方便计算机处理。

读取图片采用os库，读取特定后缀的子集图片，并且定义两个集合，一个作为图片集的合集，一个作为标签集合。

模型设计：模型目前有比较多的现有模型，可以使用CNN卷积神级网络，可以使用YOLOV8的模型。通过文献可以知道，在分类问题上可以引入密集卷积网络(DenseNet)，将其与YOLOv5s的C3模块进行融合，提出C3_DenseNet模块，以缓解训练过程中的可能会存在的梯度消失问题，并加强特征层之间的特征传递。

最后采用softmax分类交叉熵损失函数得到每张预测图片的概率分布，最大概率表示最有可能的类别。

posted @ 2024-01-05 09:43 cojames 阅读(460) 评论(3) 收藏举报

刷新页面返回顶部

copyjames

九天只能井盖隐患识别学习心得

公告