Fork me on GitHub

随笔分类 -  计算机视觉-CV

摘要:目录 Linux 查看 CUDA 版本 查看 cuDNN 版本 Windows 查看 CUDA 版本 查看 cuDNN 版本 使用 PyTorch 查看 CUDA 和 cuDNN 版本 References Linux 查看 CUDA 版本 方法一: nvcc --version 或 nvcc -V 阅读全文
posted @ 2021-12-13 14:43 stardsd 阅读(3767) 评论(1) 推荐(1) 编辑
摘要:cvpods, a versatile and efficient codebase for many computer vision tasks: classification, segmentation, detection, self-supervised learning, keypoint 阅读全文
posted @ 2021-12-13 10:22 stardsd 阅读(1057) 评论(0) 推荐(0) 编辑
摘要:Pytorch图像预处理时,通常使用transforms.Normalize(mean, std)对图像按通道进行标准化,即减去均值,再除以方差。这样做可以加快模型的收敛速度。其中参数mean和std分别表示图像每个通道的均值和方差序列。 Imagenet数据集的均值和方差为:mean=(0.485 阅读全文
posted @ 2021-10-28 17:03 stardsd 阅读(5216) 评论(0) 推荐(0) 编辑
摘要:原文链接:https://zhuanlan.zhihu.com/p/353680367 此篇文章内容源自 Attention Is All You Need,若侵犯版权,请告知本人删帖。 原论文下载地址: https://papers.nips.cc/paper/2017/file/3f5ee243 阅读全文
posted @ 2021-08-16 11:27 stardsd 阅读(560) 评论(0) 推荐(0) 编辑
摘要:mobilenet 中的通道数为什么要使用 _make_divisible 函数确保为 8 的整数倍? 问题 今天阅读一段 PyTorch 版的 mobilenet 时,发现了下面这个函数: def _make_divisible(v, divisor, min_value=None): """ T 阅读全文
posted @ 2021-06-21 10:16 stardsd 阅读(906) 评论(0) 推荐(0) 编辑
摘要:背景知识 在说 torch.backends.cudnn.benchmark 之前,我们首先简单介绍一下 cuDNN。cuDNN 是英伟达专门为深度神经网络所开发出来的 GPU 加速库,针对卷积、池化等等常见操作做了非常多的底层优化,比一般的 GPU 程序要快很多。大多数主流深度学习框架都支持 cu 阅读全文
posted @ 2021-06-03 17:10 stardsd 阅读(958) 评论(0) 推荐(0) 编辑
摘要:如何实现高速卷积?深度学习库使用了这些「黑魔法」 使用深度学习库可以大幅加速CNN模型运行,那么这些库中的哪些具体的做法实现了这种高速度和高性能呢?佐治亚理工学院计算机科学硕士研究生Manas Sahni在自己的电脑上试验了多种方法的策略,深入剖析高速卷积的实现过程。 我的笔记本电脑CPU还可以,在 阅读全文
posted @ 2021-06-03 16:43 stardsd 阅读(1150) 评论(0) 推荐(0) 编辑
摘要:戴思达 YOLOv1 使用来自整张图像的特征来预测每个bounding box 将整张图分成S*S的网格,如果一个物体的中心落在某个网格中,就用该网格检测这个物体。 每个网格预测B个bounding box,以及对应的置信度。 置信度的含义: 模型确定这个box包含有物体的程度 模型认为box属于预 阅读全文
posted @ 2021-05-12 15:35 stardsd 阅读(12249) 评论(0) 推荐(0) 编辑
摘要:YOLO9000 VOC数据集可以检测20种对象,但实际上对象的种类非常多,只是缺少相应的用于对象检测的训练样本。YOLO2尝试利用ImageNet非常大量的分类样本,联合COCO的对象检测数据集一起训练,使得YOLO2即使没有学过很多对象的检测样本,也能检测出这些对象。 基本的思路是,如果是检测样 阅读全文
posted @ 2021-04-26 16:52 stardsd 阅读(1010) 评论(0) 推荐(0) 编辑
摘要:前言 目标检测(Intance Detection) 和图像分割(Image Segmantation) 算是深度学习中两个个比较热门的项目了,单级式检测(YOLO、SSD)和双级式检测(Fast R-Cnn)代表了如今大多数的目标检测方法,而FCN、U-net、Deeplab则引领了图像分割的潮流 阅读全文
posted @ 2021-04-21 10:57 stardsd 阅读(13583) 评论(0) 推荐(0) 编辑
摘要:在使用pytorch的时候利用下面的语句指定GPU为仅为"6",但是用nvidia-smi查看GPU使用时,仍默认为"0"号 import pytorchimport osos.environ['CUDA_VISIBLE_DEVICES'] = '6'解决方案:将上述语句放到当前这个python文件 阅读全文
posted @ 2021-04-20 18:27 stardsd 阅读(6300) 评论(0) 推荐(0) 编辑
摘要:卷积神经网络为什么具有平移不变性? 在我们读计算机视觉的相关论文时,经常会看到平移不变性这个词,本文将介绍卷积神经网络中的平移不变性是什么,以及为什么具有平移不变性。 什么是平移不变性 不变性 不变性意味着即使目标的外观发生了某种变化,但是你依然可以把它识别出来。这对图像分类来说是一种很好的特性,因 阅读全文
posted @ 2021-04-20 16:39 stardsd 阅读(1945) 评论(0) 推荐(0) 编辑
摘要:来自这篇论文:<Learning Spatial Fusion for Single-Shot Object Detection> 论文地址:https://arxiv.org/pdf/1911.09516v1.pdf 代码地址:https://github.com/ruinmessi/ASFF 捕 阅读全文
posted @ 2021-04-19 10:43 stardsd 阅读(5925) 评论(0) 推荐(0) 编辑
摘要:检测算法实际同时作检测(坐标回归)和判别(分类),并且从直觉上讲,后者依赖于前者。而YOLO v3是个多任务,同时完成这2项任务。这与我以前常见的任务不一样,是个很好的学习案例。而在学习YOLOv3之前以及过程中,先后产生了许许多多的疑问。例如: 多个cell,多个anchor,在训练时哪个与gro 阅读全文
posted @ 2021-04-15 15:33 stardsd 阅读(379) 评论(0) 推荐(0) 编辑
摘要:未来 5-10年计算机视觉发展趋势 来源: CCF计算机视觉专委会 引言 计算机视觉是人工智能的“眼睛”,是感知客观世界的核心技术。进入 21世纪以来,计算机视觉领域蓬勃发展,各种理论与方法大量涌现,并在多个核心问题上取得了令人瞩目的成果。为了进一步推动计算机视觉领域的发展,CCF-CV组织了RAC 阅读全文
posted @ 2021-04-01 09:45 stardsd 阅读(2714) 评论(0) 推荐(0) 编辑
摘要:你想获得双倍训练速度的快感吗? 你想让你的显存空间瞬间翻倍吗? 如果我告诉你只需要三行代码即可实现,你信不? 在这篇博客里,瓦砾会详解一下混合精度计算(Mixed Precision),并介绍一款Nvidia开发的基于PyTorch的混合精度训练加速神器--Apex,最近Apex更新了API,可以用 阅读全文
posted @ 2021-03-30 16:26 stardsd 阅读(2069) 评论(0) 推荐(0) 编辑
摘要:1.实数数的表示 参考深入理解C语言-03-有符号数,定点数,浮点数 1.1定点数 一般在没有FPU寄存器的嵌入式系统中使用比较多。比如常见的32位系统中,将高16位作为整数部分,低16位作为小数部分。这样就可以用整数来模拟定点数的 + - * / 运算。关于定点数的数学分析,请参考以下文档:htt 阅读全文
posted @ 2021-03-30 16:02 stardsd 阅读(14951) 评论(0) 推荐(0) 编辑
摘要:论文地址: MobileNets: Efficient Convolutional Neural Networks for Mobile Vision Applications​arxiv.org MobileNet的核心就是Depthwise separable convolution(深度可分离 阅读全文
posted @ 2021-03-17 15:08 stardsd 阅读(2496) 评论(0) 推荐(0) 编辑
摘要:原文: https://pytorch.org/tutorials/advanced/super_resolution_with_onnxruntime.html 注意 单击此处的下载完整的示例代码 在本教程中,我们描述了如何将 PyTorch 中定义的模型转换为 ONNX 格式,然后在 ONNX 阅读全文
posted @ 2021-03-15 14:23 stardsd 阅读(7720) 评论(0) 推荐(0) 编辑
摘要:1. Introduction #### PIL(Python Image Library)是python的第三方图像处理库,但是由于其强大的功能与众多的使用人数,几乎已经被认为是python官方图像处理库了。其官方主页为:PIL。 PIL历史悠久,原来是只支持python2.x的版本的,后来出现了 阅读全文
posted @ 2021-03-11 17:21 stardsd 阅读(10447) 评论(0) 推荐(0) 编辑