深度学习 - 随笔分类(第3页) - stardsd

pytorch对权重文件（model.pth / model.weights）的处理方式

摘要：pytorch 打印模型层的名字的多个方式，以及对应显示，删除最后多个层的两种方式 def forward(self, x, last_cont=None): x = self.model(x) if self.use_dcl: mask = self.Convmask(x) mask = self 阅读全文

posted @ 2021-06-29 10:26 stardsd 阅读(3471) 评论(0) 推荐(1) 编辑

Mobilenet 通道数为什么是8的整数倍？

摘要：mobilenet 中的通道数为什么要使用 _make_divisible 函数确保为 8 的整数倍？问题今天阅读一段 PyTorch 版的 mobilenet 时，发现了下面这个函数： def _make_divisible(v, divisor, min_value=None): """ T 阅读全文

posted @ 2021-06-21 10:16 stardsd 阅读(943) 评论(0) 推荐(0) 编辑

Pytorch 中 model.eval() 和 with torch.no_grad() 的区别

摘要：model.eval()和with torch.no_grad()的区别在PyTorch中进行validation时，会使用model.eval()切换到测试模式，在该模式下，主要用于通知dropout层和batchnorm层在train和val模式间切换在train模式下，dropout网络层会阅读全文

posted @ 2021-06-18 14:33 stardsd 阅读(5981) 评论(0) 推荐(2) 编辑

Pytorch 编写代码基本思想（代码框架与流程）

摘要：作者：忆臻 (哈工大SCIR实验室在读博士生)魏福煊哈工大英才实验班本科生谢天宝哈工大英才实验班本科生一、前言在我们要用pytorch构建自己的深度学习模型的时候，基本上都是下面这个流程步骤，写在这里让一些新手童鞋学习的时候有一个大局感觉，无论是从自己写，还是阅读他人代码，按照这个步骤思想（阅读全文

posted @ 2021-06-18 10:05 stardsd 阅读(2032) 评论(0) 推荐(3) 编辑

微软开源工具包NNI：自动特征工程、NAS、超参调优、模型压缩

摘要：NNI (Neural Network Intelligence) 是一个轻量但强大的工具包，帮助用户自动的进行特征工程，神经网络架构搜索，超参调优以及模型压缩。 NNI 管理自动机器学习 (AutoML) 的 Experiment，调度运行由调优算法生成的 Trial 任务来找到最好的神经阅读全文

posted @ 2021-06-17 10:54 stardsd 阅读(1504) 评论(0) 推荐(1) 编辑

Pytorch：模型的保存与加载 torch.load()、torch.nn.Module.load_state_dict()

摘要：Pytorch：模型的保存与加载 torch.save()、torch.load()、torch.nn.Module.load_state_dict() Pytorch 保存和加载模型后缀：.pt 和.pth 1 torch.save() [source]保存一个序列化（serialized）的目标阅读全文

posted @ 2021-06-15 10:50 stardsd 阅读(10767) 评论(0) 推荐(0) 编辑

torch.backends.cudnn.benchmark的设置技巧

摘要：背景知识在说 torch.backends.cudnn.benchmark 之前，我们首先简单介绍一下 cuDNN。cuDNN 是英伟达专门为深度神经网络所开发出来的 GPU 加速库，针对卷积、池化等等常见操作做了非常多的底层优化，比一般的 GPU 程序要快很多。大多数主流深度学习框架都支持 cu 阅读全文

posted @ 2021-06-03 17:10 stardsd 阅读(1029) 评论(0) 推荐(0) 编辑

卷积操作的高速实现

摘要：如何实现高速卷积？深度学习库使用了这些「黑魔法」使用深度学习库可以大幅加速CNN模型运行，那么这些库中的哪些具体的做法实现了这种高速度和高性能呢？佐治亚理工学院计算机科学硕士研究生Manas Sahni在自己的电脑上试验了多种方法的策略，深入剖析高速卷积的实现过程。我的笔记本电脑CPU还可以，在阅读全文

posted @ 2021-06-03 16:43 stardsd 阅读(1199) 评论(0) 推荐(0) 编辑

YOLO v1 ~ YOLO v5 论文解读和实现细节

摘要：戴思达 YOLOv1 使用来自整张图像的特征来预测每个bounding box 将整张图分成S*S的网格，如果一个物体的中心落在某个网格中，就用该网格检测这个物体。每个网格预测B个bounding box，以及对应的置信度。置信度的含义：模型确定这个box包含有物体的程度模型认为box属于预阅读全文

posted @ 2021-05-12 15:35 stardsd 阅读(12457) 评论(0) 推荐(0) 编辑

YOLO 9000 中的WordTree细节问题

摘要：YOLO9000 VOC数据集可以检测20种对象，但实际上对象的种类非常多，只是缺少相应的用于对象检测的训练样本。YOLO2尝试利用ImageNet非常大量的分类样本，联合COCO的对象检测数据集一起训练，使得YOLO2即使没有学过很多对象的检测样本，也能检测出这些对象。基本的思路是，如果是检测样阅读全文

posted @ 2021-04-26 16:52 stardsd 阅读(1058) 评论(0) 推荐(0) 编辑

Pytorch 指定GPU号

摘要：在使用pytorch的时候利用下面的语句指定GPU为仅为"6"，但是用nvidia-smi查看GPU使用时，仍默认为"0"号 import pytorchimport osos.environ['CUDA_VISIBLE_DEVICES'] = '6'解决方案：将上述语句放到当前这个python文件阅读全文

posted @ 2021-04-20 18:27 stardsd 阅读(6512) 评论(0) 推荐(0) 编辑

平移不变性

摘要：卷积神经网络为什么具有平移不变性？在我们读计算机视觉的相关论文时，经常会看到平移不变性这个词，本文将介绍卷积神经网络中的平移不变性是什么，以及为什么具有平移不变性。什么是平移不变性不变性不变性意味着即使目标的外观发生了某种变化，但是你依然可以把它识别出来。这对图像分类来说是一种很好的特性，因阅读全文

posted @ 2021-04-20 16:39 stardsd 阅读(2000) 评论(0) 推荐(0) 编辑

自适应特征融合（Adaptively Spatial Feature Fusion: ASFF）

摘要：来自这篇论文：<Learning Spatial Fusion for Single-Shot Object Detection> 论文地址:https://arxiv.org/pdf/1911.09516v1.pdf 代码地址:https://github.com/ruinmessi/ASFF 捕阅读全文

posted @ 2021-04-19 10:43 stardsd 阅读(6351) 评论(0) 推荐(0) 编辑

YOLO论文和代码细节

摘要：检测算法实际同时作检测（坐标回归）和判别（分类），并且从直觉上讲，后者依赖于前者。而YOLO v3是个多任务，同时完成这2项任务。这与我以前常见的任务不一样，是个很好的学习案例。而在学习YOLOv3之前以及过程中，先后产生了许许多多的疑问。例如：多个cell，多个anchor，在训练时哪个与gro 阅读全文

posted @ 2021-04-15 15:33 stardsd 阅读(400) 评论(0) 推荐(0) 编辑

超参数进化 Hyperparameter Evolution

摘要：前言yolov5提供了一种超参数优化的方法–Hyperparameter Evolution，即超参数进化。超参数进化是一种利用遗传算法(GA) 进行超参数优化的方法，我们可以通过该方法选择更加合适自己的超参数。提供的默认参数也是通过在COCO数据集上使用超参数进化得来的。由于超参数进化会耗费大阅读全文

posted @ 2021-04-15 15:08 stardsd 阅读(4362) 评论(0) 推荐(1) 编辑

PyTorch的动态学习率和optimizer.param_groups[0]

摘要：如何设置PyTorch的动态学习率本文主要涉及内容：Optimizer、_LRScheduler等源码分析。本文依旧基于PyTorch 1.1.0。 Optimizer PyTorch提供了torch.optim.lr_scheduler来帮助用户改变学习率，下边将从Optimizer入手，看一下阅读全文

posted @ 2021-04-13 15:10 stardsd 阅读(6938) 评论(0) 推荐(0) 编辑

学习率策略之 burn-in

摘要：darknet的cfg文件中有一个配置参数: burn_in burn_in=1000这个参数在caffe中是没有的，一旦设置了这个参数，当update_num小于burn_in时，不是使用配置的学习速率更新策略，而是按照下面的公式更新 lr = base_lr * power(batch_num/ 阅读全文

posted @ 2021-04-13 12:38 stardsd 阅读(1881) 评论(0) 推荐(0) 编辑

Pytorch中dataloader之enumerate与iter，tqdm

摘要：dataloader本质上是一个可迭代对象，使用iter()访问，不能使用next()访问；使用iter(dataloader)返回的是一个迭代器，然后可以使用next访问；也可以使用for inputs,labels in enumerate(dataloader)形式访问，但是enumera 阅读全文

posted @ 2021-04-12 17:11 stardsd 阅读(4841) 评论(0) 推荐(0) 编辑

指数移动平均（EMA）的原理及PyTorch实现

摘要：【炼丹技巧】在深度学习中，经常会使用EMA（指数移动平均）这个方法对模型的参数做平均，以求提高测试指标并增加模型鲁棒。今天瓦砾准备介绍一下EMA以及它的Pytorch实现代码。 EMA的定义指数移动平均（Exponential Moving Average）也叫权重移动平均（Weighted 阅读全文

posted @ 2021-04-12 09:23 stardsd 阅读(5918) 评论(0) 推荐(1) 编辑

深度前馈网络与Xavier初始化原理

摘要：前言基本的神经网络的知识（一般化模型、前向计算、反向传播及其本质、激活函数等）小夕已经介绍完毕，本文先讲一下深度前馈网络的BP过程，再基于此来重点讲解在前馈网络中用来初始化model参数的Xavier方法的原理。前向前向过程很简单，每一层与下一层的连接边(即参数)构成了一个矩阵(即线性映射)，阅读全文

posted @ 2021-04-08 10:02 stardsd 阅读(295) 评论(0) 推荐(0) 编辑

赏月斋

慎终如始宁静致远

随笔分类 - 深度学习

公告

赏月斋

慎终如始 宁静致远

随笔分类 - 深度学习

公告

慎终如始宁静致远