计算机视觉-CV - 随笔分类(第3页) - stardsd

视频的编解码格式

摘要：概念术语两大组织主导视频压缩的组织及其联合(joint)组织 ITU-T(VCEG)ITU-T的中文名称是国际电信联盟远程通信标准化组织(ITU-T for ITU Telecommunication Standardization Sector), 它是国际电信联盟管理下的专门制定远程通信相关国阅读全文

posted @ 2022-01-04 15:50 stardsd 阅读(832) 评论(0) 推荐(0) 编辑

查看CUDA和cudnn版本遇到的问题

摘要：目录 Linux 查看 CUDA 版本查看 cuDNN 版本 Windows 查看 CUDA 版本查看 cuDNN 版本使用 PyTorch 查看 CUDA 和 cuDNN 版本 References Linux 查看 CUDA 版本方法一： nvcc --version 或 nvcc -V 阅读全文

posted @ 2021-12-13 14:43 stardsd 阅读(4140) 评论(1) 推荐(1) 编辑

CVpods简介

摘要：cvpods, a versatile and efficient codebase for many computer vision tasks: classification, segmentation, detection, self-supervised learning, keypoint 阅读全文

posted @ 2021-12-13 10:22 stardsd 阅读(1077) 评论(0) 推荐(0) 编辑

计算图像数据集的均值和方差(mean, std)用于transforms.Normalize()标准化

摘要：Pytorch图像预处理时，通常使用transforms.Normalize(mean, std)对图像按通道进行标准化，即减去均值，再除以方差。这样做可以加快模型的收敛速度。其中参数mean和std分别表示图像每个通道的均值和方差序列。 Imagenet数据集的均值和方差为：mean=(0.485 阅读全文

posted @ 2021-10-28 17:03 stardsd 阅读(5600) 评论(0) 推荐(0) 编辑

Attention Is All You Need

摘要：原文链接：https://zhuanlan.zhihu.com/p/353680367 此篇文章内容源自 Attention Is All You Need，若侵犯版权，请告知本人删帖。原论文下载地址： https://papers.nips.cc/paper/2017/file/3f5ee243 阅读全文

posted @ 2021-08-16 11:27 stardsd 阅读(614) 评论(0) 推荐(0) 编辑

Mobilenet 通道数为什么是8的整数倍？

摘要：mobilenet 中的通道数为什么要使用 _make_divisible 函数确保为 8 的整数倍？问题今天阅读一段 PyTorch 版的 mobilenet 时，发现了下面这个函数： def _make_divisible(v, divisor, min_value=None): """ T 阅读全文

posted @ 2021-06-21 10:16 stardsd 阅读(943) 评论(0) 推荐(0) 编辑

torch.backends.cudnn.benchmark的设置技巧

摘要：背景知识在说 torch.backends.cudnn.benchmark 之前，我们首先简单介绍一下 cuDNN。cuDNN 是英伟达专门为深度神经网络所开发出来的 GPU 加速库，针对卷积、池化等等常见操作做了非常多的底层优化，比一般的 GPU 程序要快很多。大多数主流深度学习框架都支持 cu 阅读全文

posted @ 2021-06-03 17:10 stardsd 阅读(1029) 评论(0) 推荐(0) 编辑

卷积操作的高速实现

摘要：如何实现高速卷积？深度学习库使用了这些「黑魔法」使用深度学习库可以大幅加速CNN模型运行，那么这些库中的哪些具体的做法实现了这种高速度和高性能呢？佐治亚理工学院计算机科学硕士研究生Manas Sahni在自己的电脑上试验了多种方法的策略，深入剖析高速卷积的实现过程。我的笔记本电脑CPU还可以，在阅读全文

posted @ 2021-06-03 16:43 stardsd 阅读(1199) 评论(0) 推荐(0) 编辑

YOLO v1 ~ YOLO v5 论文解读和实现细节

摘要：戴思达 YOLOv1 使用来自整张图像的特征来预测每个bounding box 将整张图分成S*S的网格，如果一个物体的中心落在某个网格中，就用该网格检测这个物体。每个网格预测B个bounding box，以及对应的置信度。置信度的含义：模型确定这个box包含有物体的程度模型认为box属于预阅读全文

posted @ 2021-05-12 15:35 stardsd 阅读(12457) 评论(0) 推荐(0) 编辑

YOLO 9000 中的WordTree细节问题

摘要：YOLO9000 VOC数据集可以检测20种对象，但实际上对象的种类非常多，只是缺少相应的用于对象检测的训练样本。YOLO2尝试利用ImageNet非常大量的分类样本，联合COCO的对象检测数据集一起训练，使得YOLO2即使没有学过很多对象的检测样本，也能检测出这些对象。基本的思路是，如果是检测样阅读全文

posted @ 2021-04-26 16:52 stardsd 阅读(1058) 评论(0) 推荐(0) 编辑

mAP,AP,APs,APm,APl,AP0.5等概念理解

摘要：前言目标检测(Intance Detection) 和图像分割(Image Segmantation) 算是深度学习中两个个比较热门的项目了，单级式检测(YOLO、SSD)和双级式检测(Fast R-Cnn)代表了如今大多数的目标检测方法，而FCN、U-net、Deeplab则引领了图像分割的潮流阅读全文

posted @ 2021-04-21 10:57 stardsd 阅读(14589) 评论(0) 推荐(0) 编辑

Pytorch 指定GPU号

摘要：在使用pytorch的时候利用下面的语句指定GPU为仅为"6"，但是用nvidia-smi查看GPU使用时，仍默认为"0"号 import pytorchimport osos.environ['CUDA_VISIBLE_DEVICES'] = '6'解决方案：将上述语句放到当前这个python文件阅读全文

posted @ 2021-04-20 18:27 stardsd 阅读(6512) 评论(0) 推荐(0) 编辑

平移不变性

摘要：卷积神经网络为什么具有平移不变性？在我们读计算机视觉的相关论文时，经常会看到平移不变性这个词，本文将介绍卷积神经网络中的平移不变性是什么，以及为什么具有平移不变性。什么是平移不变性不变性不变性意味着即使目标的外观发生了某种变化，但是你依然可以把它识别出来。这对图像分类来说是一种很好的特性，因阅读全文

posted @ 2021-04-20 16:39 stardsd 阅读(2000) 评论(0) 推荐(0) 编辑

自适应特征融合（Adaptively Spatial Feature Fusion: ASFF）

摘要：来自这篇论文：<Learning Spatial Fusion for Single-Shot Object Detection> 论文地址:https://arxiv.org/pdf/1911.09516v1.pdf 代码地址:https://github.com/ruinmessi/ASFF 捕阅读全文

posted @ 2021-04-19 10:43 stardsd 阅读(6351) 评论(0) 推荐(0) 编辑

YOLO论文和代码细节

摘要：检测算法实际同时作检测（坐标回归）和判别（分类），并且从直觉上讲，后者依赖于前者。而YOLO v3是个多任务，同时完成这2项任务。这与我以前常见的任务不一样，是个很好的学习案例。而在学习YOLOv3之前以及过程中，先后产生了许许多多的疑问。例如：多个cell，多个anchor，在训练时哪个与gro 阅读全文

posted @ 2021-04-15 15:33 stardsd 阅读(400) 评论(0) 推荐(0) 编辑

计算机视觉技术（Computer Vision，CV）：发展趋势2025~2030

摘要：未来 5-10年计算机视觉发展趋势来源： CCF计算机视觉专委会引言计算机视觉是人工智能的“眼睛”，是感知客观世界的核心技术。进入 21世纪以来，计算机视觉领域蓬勃发展，各种理论与方法大量涌现，并在多个核心问题上取得了令人瞩目的成果。为了进一步推动计算机视觉领域的发展，CCF-CV组织了RAC 阅读全文

posted @ 2021-04-01 09:45 stardsd 阅读(2943) 评论(0) 推荐(0) 编辑

基于Apex的混合精度加速：半精度浮点数FP16

摘要：你想获得双倍训练速度的快感吗？你想让你的显存空间瞬间翻倍吗？如果我告诉你只需要三行代码即可实现，你信不？在这篇博客里，瓦砾会详解一下混合精度计算（Mixed Precision），并介绍一款Nvidia开发的基于PyTorch的混合精度训练加速神器--Apex，最近Apex更新了API，可以用阅读全文

posted @ 2021-03-30 16:26 stardsd 阅读(2199) 评论(0) 推荐(0) 编辑

浮点运算：双精度、单精度、半精度浮点数计算（FP16/FP32/FP64），浮点和定点

摘要：1.实数数的表示参考深入理解C语言-03-有符号数，定点数，浮点数 1.1定点数一般在没有FPU寄存器的嵌入式系统中使用比较多。比如常见的32位系统中，将高16位作为整数部分，低16位作为小数部分。这样就可以用整数来模拟定点数的 + - * / 运算。关于定点数的数学分析，请参考以下文档：htt 阅读全文

posted @ 2021-03-30 16:02 stardsd 阅读(15787) 评论(0) 推荐(0) 编辑

MobileNet V1 深度可分离卷积（depthwise & pointwise convolution）

摘要：论文地址： MobileNets: Efficient Convolutional Neural Networks for Mobile Vision Applicationsarxiv.org MobileNet的核心就是Depthwise separable convolution（深度可分离阅读全文

posted @ 2021-03-17 15:08 stardsd 阅读(2715) 评论(0) 推荐(0) 编辑

将模型从 PyTorch 导出到 ONNX 并使用 ONNX Runtime 运行

摘要：原文： https://pytorch.org/tutorials/advanced/super_resolution_with_onnxruntime.html 注意单击此处的下载完整的示例代码在本教程中，我们描述了如何将 PyTorch 中定义的模型转换为 ONNX 格式，然后在 ONNX 阅读全文

posted @ 2021-03-15 14:23 stardsd 阅读(8049) 评论(0) 推荐(0) 编辑

赏月斋

慎终如始宁静致远

随笔分类 - 计算机视觉-CV

公告

赏月斋

慎终如始 宁静致远

随笔分类 - 计算机视觉-CV

公告

慎终如始宁静致远