随笔分类 -  深度学习

摘要:前面介绍了图像分类网络,并重点解析了ResNet及其应用以及MobileNet系列的轻量化分类网络,这一篇接着介绍图像目标检测网络。 目标检测具有巨大的实用价值和应用前景。 应用领域包括人脸检测、行人检测、车辆检测、飞机航拍或卫星图像中道路的检测、车载摄像机图像中的障碍物检测、医学影像在的病灶检测等 阅读全文
posted @ 2023-09-15 15:16 半夜打老虎 阅读(366) 评论(0) 推荐(0) 编辑
摘要:前面介绍了MobileNetV1和MobileNetV2,这次介绍这个系列最后一篇MobileNetV3,它沿用了V1的深度可分离卷积以及v2的倒残差网络和瓶颈层,再其基础上做了一系列优化,保证精度最大化的同时减少网络延时。主要改进点包含以下几步: 引入NetAdapt算法自动获取扩展层和瓶颈层的通 阅读全文
posted @ 2023-09-08 10:52 半夜打老虎 阅读(382) 评论(0) 推荐(0) 编辑
摘要:前面利用ResNet18实现了二分类,这里借助分类网络来识别图片和视频中不同肤色的人数。大体流程可以分为以下几步:数据获取、数据处理、模型训练、图片识别以及视频识别,其中大部分内容参考《机器视觉之TensorFlow2入门、原理与应用实践》第4章。 一、数据获取 这里获取黑人和白人模特数据用于训练。 阅读全文
posted @ 2023-08-15 10:52 半夜打老虎 阅读(122) 评论(0) 推荐(0) 编辑
摘要:前一篇实现了OpenCV推理ResNet18, 这一篇采用腾讯的NCNN框架实现ResNet18推理。 一、准备 1、 NCNN编译及安装 同OpenCV推理一样,首先需要准备NCNN,NCNN源码编译及安装可参考: https://www.cnblogs.com/xiaxuexiaoab/p/16 阅读全文
posted @ 2023-07-26 16:28 半夜打老虎 阅读(328) 评论(0) 推荐(0) 编辑
摘要:前一篇实现了ResNet18训练自定义数据集,详细介绍了数据集制作、模型构建及训练,并且介绍了相应模块如何可视化。前面训练阶段是在python环境下进行的,但实际工程部署的时候大都采用C++实现推理,这一篇我们借助OpenCV实现ResNet18推理。 一、准备 1、OpenCV编译及安装 借助Op 阅读全文
posted @ 2023-07-21 16:40 半夜打老虎 阅读(250) 评论(0) 推荐(0) 编辑
摘要:前面一篇内容讲解了如何利用Pytorch实现ResNet,这一篇我们用ResNet18实现一个二分类。接下来从模型、数据及训练三个方面展开。 一、目标 利用ResNet18将以下数据分为两类 class_0 class_1 二、模型 ResNet系列的模型在上一篇已经详细介绍了,这里采用ResNet 阅读全文
posted @ 2023-07-13 21:10 半夜打老虎 阅读(1295) 评论(0) 推荐(0) 编辑
摘要:一、为什么引入ResNet 通过上一篇分类网络的介绍,我们知道网络的宽度和深度可以很好的提高网络的性能,深的网络一般都比浅的的网络效果好,但训练一个很深的网络是非常困难的,一方面是网络越深越容易出现梯度消失和梯度爆炸问题, 然而这个问题通过BN层和ReLU激活函数等方法在很大程度上已经得到解决;另一 阅读全文
posted @ 2023-05-25 20:22 半夜打老虎 阅读(495) 评论(0) 推荐(0) 编辑
摘要:深度学习在2D视觉领域分类 一、图像分类 图像分类是指将数字图像自动分类到不同的预先定义类别中。 二、目标检测 目标检测是指在图像或视频中自动识别和定位特定物体的任务。与图像分类不同,它不仅需要确定物体的类别,还需要找出物体在图像中的位置。 按照框分类又可以分为平行框检测和旋转框检测。 平行框 旋转 阅读全文
posted @ 2023-05-15 22:16 半夜打老虎 阅读(136) 评论(1) 推荐(0) 编辑
摘要:分类网络 深度学习在图像邻域的应用大致可以分为图像分类、目标检测、图像分割三大类,其中图像分割又可以细分为语义分割、实例分割和全景分割,这一篇梳理下常见的分类数据集和分类网络,后续会重点介绍ResNet,并逐步实现ResNet训练及推理。 一、常用分类数据集 MNIST 内容是0-9的手写数字,60 阅读全文
posted @ 2023-05-08 22:30 半夜打老虎 阅读(1773) 评论(0) 推荐(0) 编辑
摘要:本文对接触到的深度学习相关内容做一个梳理。 一、深度学习 1. 深度学习是什么 深度学习(Deep Learning)是机器学习(Machine Learning)的一个研究方向,而机器学习属于人工智能(AI, Artificial Intelligence)的范畴,人工智能是研究、开发用于模拟、延 阅读全文
posted @ 2023-04-19 22:48 半夜打老虎 阅读(329) 评论(0) 推荐(0) 编辑
摘要:一、ncnn模型 可由ncnn库中的onnx2ncnn工具将onnx格式模型转换为ncnn格式的.param和.bin两个文件,其中param记录了各算子,param文件可直接由可视化工具Nerton打开查看,这里记录下param文件格式。ncnn模型的加载参考:ncnn加载模型的几种方式 二、pa 阅读全文
posted @ 2023-03-28 22:28 半夜打老虎 阅读(844) 评论(0) 推荐(0) 编辑
摘要:在目标检测时通常需要计算包围框的IOU,用于判断正负样本以及后续NMS过滤。框A和框B的IOU的值为其交集面积除以并集面积, IOU=AreaABAreaAB 如果框为轴向包围盒,则可以参考IOU及NMS实现 ,但有时会遇到旋转框问题 阅读全文
posted @ 2023-01-15 16:03 半夜打老虎 阅读(1846) 评论(0) 推荐(0) 编辑
摘要:一、BN层作用 批量归一化(Batch Normalization,BN)在深度学习中常放在卷积层之后,BN层有以下优点: 减少了人为选择参数。在某些情况下可以取消 dropout 和 L2 正则项参数,或者采取更小的 L2 正则项约束参数; 减少了对学习率的要求。现在我们可以使用初始很大的学习率或 阅读全文
posted @ 2022-10-27 21:29 半夜打老虎 阅读(1436) 评论(0) 推荐(0) 编辑
摘要:DOTA数据集官网: http://captain.whu.edu.cn/DOTAweb/index.html 官网提供水平和旋转目标提交接口,可以看到检测结果实时排行榜: http://captain.whu.edu.cn/DOTAweb/results.html 一、关键节点 1.1 更多的框 阅读全文
posted @ 2022-10-18 09:38 半夜打老虎 阅读(207) 评论(0) 推荐(0) 编辑
摘要:Yolo系列简单汇总一(yolov1至yolov5)见: https://www.cnblogs.com/xiaxuexiaoab/p/16615242.html 六、YoloX pdf: https://arxiv.org/pdf/2107.08430.pdf code: https://gith 阅读全文
posted @ 2022-09-01 08:57 半夜打老虎 阅读(2336) 评论(0) 推荐(0) 编辑
摘要:Yolo系列简单汇总二(yolox yolo6 yolo7)见:https://www.cnblogs.com/xiaxuexiaoab/p/16643821.html 一、YoloV1 pdf: https://arxiv.org/pdf/1506.02640.pdf code: https:// 阅读全文
posted @ 2022-08-31 17:11 半夜打老虎 阅读(1671) 评论(0) 推荐(0) 编辑
摘要:yolov5代码:https://github.com/ultralytics/yolov5 ncnn yolov5推理代码: https://github.com/Tencent/ncnn/blob/master/examples/yolov5.cpp 1. 导出训练好的模型为onnx格式 这里如 阅读全文
posted @ 2022-08-30 15:56 半夜打老虎 阅读(1987) 评论(1) 推荐(0) 编辑
摘要:一、常用转换工具 在ncnn库编译完成后,在bin目录下有很多工具, 编译可参考ncnn编译与安装 onnx2ncnn 利用ncnn库的./onnx2ncnn 工具进行转换 onnx2ncnn *.onnx *.param *.bin 转换时如果报以下错误提示 ,则利用onnxsim库先对onnx模 阅读全文
posted @ 2022-08-30 09:57 半夜打老虎 阅读(1478) 评论(0) 推荐(0) 编辑
摘要:一、数据集制作 1.1 标注 我采用的是Labelme工具:https://github.com/wkentaro/labelme 分割需要得到物体的掩膜信息,这里是利用Labelme标注出物体的一圈轮廓,然后再将其转换为掩膜及对应的目标框。 标注完成后一张图片会对应一个json文件,json文件里 阅读全文
posted @ 2022-05-09 15:58 半夜打老虎 阅读(1505) 评论(10) 推荐(0) 编辑
摘要:pointNet 无序性: 低维特征(N3)经过MLP层上升到高维,然后对高维采用最大池化(对称函数) 旋转不变性: 2个TNet, 学习一个旋转矩阵,对输入进行校正,对提取的特征也进行校正 pointNet++ pointNet没有局部的概念,要不对单个点,要不对所有点进行操作,为解决这一问 阅读全文
posted @ 2022-01-11 10:28 半夜打老虎 阅读(506) 评论(2) 推荐(0) 编辑

点击右上角即可分享
微信分享提示