计算机视觉-CV - 随笔分类(第4页) - stardsd

python PIL 图像处理库(Pillow)简介

摘要：1. Introduction #### PIL(Python Image Library)是python的第三方图像处理库，但是由于其强大的功能与众多的使用人数，几乎已经被认为是python官方图像处理库了。其官方主页为:PIL。 PIL历史悠久，原来是只支持python2.x的版本的，后来出现了阅读全文

posted @ 2021-03-11 17:21 stardsd 阅读(11174) 评论(0) 推荐(0) 编辑

YOLO v3 网络结构和源码详解

摘要：0.摘要最近一段时间在学习yolo3，看了很多博客，理解了一些理论知识，但是学起来还是有些吃力，之后看了源码，才有了更进一步的理解。在这里，我不在赘述网络方面的代码，网络方面的代码比较容易理解，下面将给出整个yolo3代码的详解解析，整个源码中函数的作用以及调用关系见下图：参考：https:// 阅读全文

posted @ 2021-03-11 16:50 stardsd 阅读(2712) 评论(0) 推荐(0) 编辑

Perceptual Loss（感知损失）论文笔记

摘要：“Perceptual Losses for Real-Time Style Transfer and Super-Resolution”论文出自斯坦福大学李飞飞团队，发表于ECCV 2016 论文地址：https://arxiv.org/abs/1603.08155补充材料地址：https://c 阅读全文

posted @ 2021-03-04 14:55 stardsd 阅读(5669) 评论(0) 推荐(0) 编辑

Pytorch torchvision.utils.make_grid()用法

摘要：Pytorch torchvision.utils.make_grid()用法 make_grid的作用是将若干幅图像拼成一幅图像。其中padding的作用就是子图像与子图像之间的pad有多宽。这是padding为0的结果这是padding为2的结果在需要展示一批数据时很有用。———————— 阅读全文

posted @ 2021-03-01 10:35 stardsd 阅读(3854) 评论(0) 推荐(0) 编辑

Pytorch 分类问题输出结果的数据整理方式：_, predicted = torch.max(outputs.data, 1)

摘要：使用pytorch的小伙伴们，一定看过下面这段代码 _, predicted = torch.max(outputs.data, 1) 那么，这里的下划线_ 表示什么意思？首先，torch.max()这个函数返回的是两个值，第一个值是具体的value（我们用下划线_表示），第二个值是value所阅读全文

posted @ 2021-02-25 16:19 stardsd 阅读(3981) 评论(0) 推荐(0) 编辑

Caffe、Tensorflow和Pytorch通道维度顺序小结

摘要：N: batch; C: channel H: height W: width Caffe 的Blob通道顺序是：NCHW; Tensorflow的tensor通道顺序：默认是NHWC，也支持NCHW，使用cuDNN会更快; Pytorch中tensor的通道顺序：NCHW TensorRT中的t 阅读全文

posted @ 2021-02-25 15:16 stardsd 阅读(2637) 评论(0) 推荐(0) 编辑

Detectron2 训练+测试代码框架

摘要：1. run_predict.py import torch, torchvision import detectron2 from detectron2.utils.logger import setup_logger setup_logger import numpy as np import 阅读全文

posted @ 2021-02-22 15:36 stardsd 阅读(676) 评论(0) 推荐(0) 编辑

半小时学会 PyTorch Hook

摘要：SIGAI特约作者尹相楠里昂中央理工在读博士提到 hook，我首先想起的是动画《小飞侠》里滑稽的 captain hook，满满童年的回忆促使我 P 了张题图：虎克船长勾着 PyTorch 的 logo。同时想起的还有大名鼎鼎的胡克定律：Hooke's law（虽然不是一个 hook），当年阅读全文

posted @ 2021-02-18 16:09 stardsd 阅读(7667) 评论(1) 推荐(1) 编辑

Detectron2 获取网络中间层结果的途径

摘要：Partially execute a model: Sometimes you may want to obtain an intermediate tensor inside a model, such as the input of certain layer, the output befo 阅读全文

posted @ 2021-02-18 15:31 stardsd 阅读(619) 评论(0) 推荐(0) 编辑

Dropout（丢弃法）及其变体

摘要：一文看尽12种Dropout及其变体本文转载自：AI公园作者：Axel Thevenot 编译：ronghuaiyang 导读深入了解DNNs，CNNs以及RNNs中的Dropout来进行正则化，蒙特卡洛不确定性和模型压缩的方法。动机在深度机器学习中训练一个模型的主要挑战之一是协同适应。这阅读全文

posted @ 2021-02-15 16:02 stardsd 阅读(4249) 评论(0) 推荐(0) 编辑

pytorch 中的 gather() 函数详解

摘要：首先，给出官方文档的链接： https://pytorch.org/docs/stable/generated/torch.gather.html?highlight=gather#torch.gather 然后，我用白话翻译一下官方文档。 gather，顾名思义，聚集、集合。有点像军训的时候，排队阅读全文

posted @ 2021-02-15 14:43 stardsd 阅读(3616) 评论(0) 推荐(0) 编辑

算术编码简介

摘要：上一篇讲了LZW编码，本篇讨论另一种不同的编码算法，算数编码。和哈夫曼编码一样，算数编码是熵编码的一种，是基于数据中字符出现的概率，给不同字符以不同的编码。本文也会对这两种编码方式的相似和不同点进行比较。编码原理算数编码的原理我个人感觉其实并不太容易用三言两语直观地表达出来，其背后的数学思想则更阅读全文

posted @ 2021-02-08 11:39 stardsd 阅读(4290) 评论(0) 推荐(0) 编辑

量化参数QP：quantization parameter 以及 HEVC

摘要：一、介绍 1、量化就是把信号的连续取值映射成多个离散的幅值的过程，实现了信号取值多对一的映射。 2、残差数据进过变换之后，变换系数具有较大的取值范围，量化可以有效减小信号的取值范围，进而获得更好的压缩效果，量化是造成失真的根本原因二、衡量失真的三种准则（分别有对应的公式）： 1、均方差MSE 2、阅读全文

posted @ 2021-02-05 14:42 stardsd 阅读(3794) 评论(0) 推荐(0) 编辑

H.265 视频编码中的 CTU, CU, PU, TU

摘要：H.265将图像划分为“树编码单元（coding tree units, CTU）”，而不是像H.264那样的16×16的宏块。根据不同的编码设置，树编码块的尺寸可以被设置为64×64或有限的32×32或16×16。很多研究都展示出更大的树编码块可以提供更高的压缩效率（同样也需要更高的编码速度）。每阅读全文

posted @ 2021-02-03 10:16 stardsd 阅读(4397) 评论(0) 推荐(1) 编辑

I帧、P帧、B帧、GOP、IDR 和PTS, DTS之间的关系

摘要：一.视频传输原理二. I帧、P帧、B帧，GOP 三.PTS和DTS 一.视频传输原理视频是利用人眼视觉暂留的原理，通过播放一系列的图片，使人眼产生运动的感觉。单纯传输视频画面，视频量非常大，对现有的网络和存储来说是不可接受的。为了能够使视频便于传输和存储，人们发现视频有大量重复的信息，如果将重复阅读全文

posted @ 2021-02-02 11:14 stardsd 阅读(1881) 评论(0) 推荐(1) 编辑

视频编码率失真性能评价指标：PSNR SSIM BD-rate BD-PSNR

摘要：BD-rate 算法参考 BD-rate,全称Bjøntegaard-Delta rate, 用于评价不同的视频编码器RD（率失真）性能。写这篇博客，部分原因是发现BD-rate的中文解释完全没有。算法 1. 一个编码器，给定bitrate，计算PSNR（以Y为例）。取不同的bitrate，在阅读全文

posted @ 2021-02-01 14:40 stardsd 阅读(5961) 评论(0) 推荐(0) 编辑

矢量量化（VQ，Vector Quantization）

摘要：作者：桂。时间：2017-05-31 21:14:56 链接：http://www.cnblogs.com/xingshansi/p/6925955.html 前言 VQ（Vector Quantization）是一个常用的压缩技术，本文主要回顾： 1）VQ原理 2）基于VQ的说话人识别（SR,s 阅读全文

posted @ 2021-01-28 15:17 stardsd 阅读(1672) 评论(0) 推荐(1) 编辑

目标检测之评价指标 - mAP

摘要：AP & mAP AP：PR 曲线下面积（下面会说明） mAP：mean Average Precision, 即各类别 AP 的平均值 TP、FP、FN、TN True Positive (TP): IoU> ( 一般取 0.5 ) 的检测框数量（同一 Ground Truth 只计算一次） Fa 阅读全文

posted @ 2020-11-19 18:52 stardsd 阅读(867) 评论(0) 推荐(0) 编辑

mAP的代码实现及分析

摘要：前言对于使用机器学习解决的大多数常见问题，通常有多种可用的模型。每个模型都有自己的独特之处，并随因素变化而表现不同每个模型在“验证/测试”数据集上来评估性能，性能衡量使用各种统计量如准确度（accuracy），精度（precision），召回率（recall）等。选择的统计量通常针对特定应用场景和阅读全文

posted @ 2020-01-11 20:25 stardsd 阅读(5098) 评论(0) 推荐(0) 编辑

灰度共生矩阵（Gray-level Co-occurrence Matrix，GLCM），矩阵的特征量

摘要：又叫做灰度共现矩阵又叫做灰度共现矩阵又叫做灰度共现矩阵又叫做灰度共现矩阵 Prerequisites 概念计算方式对于精度要求高且纹理细密的纹理分布，我们取像素间距为d=1d=1，以下是方向的说明：我们来看，matlab内置工具箱中的灰度共生矩阵的生成函数graycomatrix（gra 阅读全文

posted @ 2019-08-29 20:18 stardsd 阅读(12967) 评论(0) 推荐(0) 编辑

赏月斋

慎终如始宁静致远

随笔分类 - 计算机视觉-CV

公告

赏月斋

慎终如始 宁静致远

随笔分类 - 计算机视觉-CV

公告

慎终如始宁静致远