九天只能井盖隐患识别学习心得

基本思路:

前期处理:数据集的图片集一共1800多张,分成五个类别,因此可以采用目标检测算法或者分类算法,通过观察数据集发现五种图片子集之间的样本数量并不均衡,所以这很可能会影响后续的模型效果。

因此需要对数据集扩容,扩容操作可以利用Python的爬虫爬取对应标签的井盖图片, 使得原数据集样本数量扩充到1万张左右,并且要尽可能的不修改原图片子集的综合占比。

预处理:由于每种图片的规格不一样,所以我打算将图片归一到同一长宽比例,图片是三通道,每种通道强度在0-255,因此在归一化的处理时采用除以255的操作将图片转化为0-1并且重新reshape,方便计算机处理。

读取图片采用os库,读取特定后缀的子集图片,并且定义两个集合,一个作为图片集的合集,一个作为标签集合。

模型设计:模型目前有比较多的现有模型,可以使用CNN卷积神级网络,可以使用YOLOV8的模型。通过文献可以知道,在分类问题上可以引入密集卷积网络(DenseNet),将其与YOLOv5s的C3模块进行融合,提出C3_DenseNet模块,以缓解训练过程中的可能会存在的梯度消失问题,并加强特征层之间的特征传递。

最后采用softmax分类交叉熵损失函数得到每张预测图片的概率分布,最大概率表示最有可能的类别。

posted @ 2024-01-05 09:43  cojames  阅读(411)  评论(3编辑  收藏  举报