随笔分类 - 计算机视觉
摘要:Onnx模型格式 为什么要用Onnx格式 Onnx是一种针对机器学习设计的开放式的文件格式,用于储存训练好的模型。可以使不同的深度学习框架采用相同的格式存储模型数据。``Onnx`是一种便于在各个主流深度学习框架中迁移模型的中间表达格式 ONNX与Protobuf ONNX采用序列化数据结构协议pr
阅读全文
摘要:YOLOv5训练过程 1. 数据格式转为YOLOv5需要的格式 yolov5的项目地址 YOLOv5需要图像标注的数据格式 大家都知道,用于训练的图片都是有对应的标注信息的,主要来标注图片中的待识别物体(用边界框和类别表示) 在yolov5中每一个图片对应的标注信息(边界框和类别)是存放在txt文件
阅读全文
摘要:基础模块 1.类别预测层 2.边界框预测层 和类别预测层类似,只不过每个锚框要预测4个偏移量,而不是个 3.连接多尺度的预测 每个输出的形状是(批量大小,通道数,高度,宽度) 由于不同层的特征图由于大小不一样,锚框数量不一样,因此不同层的预测输出形状可能会不同,通道数由每个特征图单元生成的
阅读全文
摘要:训练深度神经网络时调参经验 1.如果损失一直比较大,且降不下去,就是说模型在训练集和测试集上的结果都比较差 可以尝试从以下三个方面入手: (1)损失函数 如果是回归任务的损失函数有: 优先选择SmoothL1Loss函数 下面公式中的N可以看做是batch size一般是传入数据的第一个纬度,n可以
阅读全文
摘要:计算机视觉 一.计算机视觉任务 计算机视觉主要任务包括以下五种: 1.图像分类 给定一组各自被标记为单一类别的图像作为训练集,然后对新的测试图像的类别进行分类,比如MINIST手写图像识别 2.目标检测 识别图像中的对象目标,输出目标的边界框坐标和分类标签 比如鱼类检测,绝缘子检测(之前做过的) 类
阅读全文