Fork me on GitHub

随笔分类 -  计算机视觉-CV

摘要:0.摘要 最近一段时间在学习yolo3,看了很多博客,理解了一些理论知识,但是学起来还是有些吃力,之后看了源码,才有了更进一步的理解。在这里,我不在赘述网络方面的代码,网络方面的代码比较容易理解,下面将给出整个yolo3代码的详解解析,整个源码中函数的作用以及调用关系见下图: 参考:https:// 阅读全文
posted @ 2021-03-11 16:50 stardsd 阅读(2662) 评论(0) 推荐(0) 编辑
摘要:“Perceptual Losses for Real-Time Style Transfer and Super-Resolution”论文出自斯坦福大学李飞飞团队,发表于ECCV 2016 论文地址:https://arxiv.org/abs/1603.08155补充材料地址:https://c 阅读全文
posted @ 2021-03-04 14:55 stardsd 阅读(5289) 评论(0) 推荐(0) 编辑
摘要:Pytorch torchvision.utils.make_grid()用法 make_grid的作用是将若干幅图像拼成一幅图像。其中padding的作用就是子图像与子图像之间的pad有多宽。 这是padding为0的结果 这是padding为2的结果 在需要展示一批数据时很有用。———————— 阅读全文
posted @ 2021-03-01 10:35 stardsd 阅读(3814) 评论(0) 推荐(0) 编辑
摘要:使用pytorch的小伙伴们,一定看过下面这段代码 _, predicted = torch.max(outputs.data, 1) 那么,这里的 下划线_ 表示什么意思? 首先,torch.max()这个函数返回的是两个值,第一个值是具体的value(我们用下划线_表示),第二个值是value所 阅读全文
posted @ 2021-02-25 16:19 stardsd 阅读(3913) 评论(0) 推荐(0) 编辑
摘要:N: batch; C: channel H: height W: width Caffe 的Blob通道顺序是:NCHW; Tensorflow的tensor通道顺序:默认是NHWC, 也支持NCHW,使用cuDNN会更快; Pytorch中tensor的通道顺序:NCHW TensorRT中的t 阅读全文
posted @ 2021-02-25 15:16 stardsd 阅读(2576) 评论(0) 推荐(0) 编辑
摘要:1. run_predict.py import torch, torchvision import detectron2 from detectron2.utils.logger import setup_logger setup_logger import numpy as np import 阅读全文
posted @ 2021-02-22 15:36 stardsd 阅读(653) 评论(0) 推荐(0) 编辑
摘要:SIGAI特约作者 尹相楠 里昂中央理工 在读博士 提到 hook,我首先想起的是动画《小飞侠》里滑稽的 captain hook,满满童年的回忆促使我 P 了张题图:虎克船长勾着 PyTorch 的 logo。同时想起的还有大名鼎鼎的胡克定律:Hooke's law(虽然不是一个 hook),当年 阅读全文
posted @ 2021-02-18 16:09 stardsd 阅读(7364) 评论(1) 推荐(1) 编辑
摘要:Partially execute a model: Sometimes you may want to obtain an intermediate tensor inside a model, such as the input of certain layer, the output befo 阅读全文
posted @ 2021-02-18 15:31 stardsd 阅读(609) 评论(0) 推荐(0) 编辑
摘要:一文看尽12种Dropout及其变体 本文转载自:AI公园 作者:Axel Thevenot 编译:ronghuaiyang 导读 深入了解DNNs,CNNs以及RNNs中的Dropout来进行正则化,蒙特卡洛不确定性和模型压缩的方法。 动机 在深度机器学习中训练一个模型的主要挑战之一是协同适应。这 阅读全文
posted @ 2021-02-15 16:02 stardsd 阅读(4220) 评论(0) 推荐(0) 编辑
摘要:首先,给出官方文档的链接: https://pytorch.org/docs/stable/generated/torch.gather.html?highlight=gather#torch.gather 然后,我用白话翻译一下官方文档。 gather,顾名思义,聚集、集合。有点像军训的时候,排队 阅读全文
posted @ 2021-02-15 14:43 stardsd 阅读(3479) 评论(0) 推荐(0) 编辑
摘要:上一篇讲了LZW编码,本篇讨论另一种不同的编码算法,算数编码。和哈夫曼编码一样,算数编码是熵编码的一种,是基于数据中字符出现的概率,给不同字符以不同的编码。本文也会对这两种编码方式的相似和不同点进行比较。 编码原理 算数编码的原理我个人感觉其实并不太容易用三言两语直观地表达出来,其背后的数学思想则更 阅读全文
posted @ 2021-02-08 11:39 stardsd 阅读(4018) 评论(0) 推荐(0) 编辑
摘要:一、介绍 1、量化就是把信号的连续取值映射成多个离散的幅值的过程,实现了信号取值多对一的映射。 2、残差数据进过变换之后,变换系数具有较大的取值范围,量化可以有效减小信号的取值范围,进而获得更好的压缩效果,量化是造成失真的根本原因 二、衡量失真的三种准则(分别有对应的公式): 1、均方差MSE 2、 阅读全文
posted @ 2021-02-05 14:42 stardsd 阅读(3497) 评论(0) 推荐(0) 编辑
摘要:H.265将图像划分为“树编码单元(coding tree units, CTU)”,而不是像H.264那样的16×16的宏块。根据不同的编码设置,树编码块的尺寸可以被设置为64×64或有限的32×32或16×16。很多研究都展示出更大的树编码块可以提供更高的压缩效率(同样也需要更高的编码速度)。每 阅读全文
posted @ 2021-02-03 10:16 stardsd 阅读(4027) 评论(0) 推荐(1) 编辑
摘要:一.视频传输原理 二. I帧、P帧、B帧,GOP 三.PTS和DTS 一.视频传输原理 视频是利用人眼视觉暂留的原理,通过播放一系列的图片,使人眼产生运动的感觉。单纯传输视频画面,视频量非常大,对现有的网络和存储来说是不可接受的。为了能够使视频便于传输和存储,人们发现视频有大量重复的信息,如果将重复 阅读全文
posted @ 2021-02-02 11:14 stardsd 阅读(1740) 评论(0) 推荐(1) 编辑
摘要:BD-rate 算法 参考 BD-rate,全称Bjøntegaard-Delta rate, 用于评价不同的视频编码器RD(率失真)性能。 写这篇博客,部分原因是发现BD-rate的中文解释完全没有。 算法 1. 一个编码器,给定bitrate,计算PSNR(以Y为例)。取不同的bitrate,在 阅读全文
posted @ 2021-02-01 14:40 stardsd 阅读(5625) 评论(0) 推荐(0) 编辑
摘要:作者:桂。 时间:2017-05-31 21:14:56 链接:http://www.cnblogs.com/xingshansi/p/6925955.html 前言 VQ(Vector Quantization)是一个常用的压缩技术,本文主要回顾: 1)VQ原理 2)基于VQ的说话人识别(SR,s 阅读全文
posted @ 2021-01-28 15:17 stardsd 阅读(1407) 评论(0) 推荐(1) 编辑
摘要:AP & mAP AP:PR 曲线下面积(下面会说明) mAP:mean Average Precision, 即各类别 AP 的平均值 TP、FP、FN、TN True Positive (TP): IoU> ( 一般取 0.5 ) 的检测框数量(同一 Ground Truth 只计算一次) Fa 阅读全文
posted @ 2020-11-19 18:52 stardsd 阅读(837) 评论(0) 推荐(0) 编辑
摘要:前言 对于使用机器学习解决的大多数常见问题,通常有多种可用的模型。每个模型都有自己的独特之处,并随因素变化而表现不同每个模型在“验证/测试”数据集上来评估性能,性能衡量使用各种统计量如准确度(accuracy),精度(precision),召回率(recall)等。选择的统计量通常针对特定应用场景和 阅读全文
posted @ 2020-01-11 20:25 stardsd 阅读(5037) 评论(0) 推荐(0) 编辑
摘要:又叫做灰度共现矩阵 又叫做灰度共现矩阵 又叫做灰度共现矩阵 又叫做灰度共现矩阵 Prerequisites 概念 计算方式 对于精度要求高且纹理细密的纹理分布,我们取像素间距为d=1d=1,以下是方向的说明: 我们来看,matlab内置工具箱中的灰度共生矩阵的生成函数graycomatrix(gra 阅读全文
posted @ 2019-08-29 20:18 stardsd 阅读(12711) 评论(0) 推荐(0) 编辑
摘要:【图像算法】图像特征: 一 原理 几何矩是由Hu(Visual pattern recognition by moment invariants)在1962年提出的,具有平移、旋转和尺度不变性。 定义如下: ① (p+q)阶不变矩定义: ② 对于数字图像,离散化,定义为: ③ 归一化中心矩定义: ④ 阅读全文
posted @ 2019-08-29 17:04 stardsd 阅读(10107) 评论(1) 推荐(1) 编辑