随笔分类 - 深度学习
摘要:目录简介模型QuantizationEntropy estimation 简介 训练这种基于网络的压缩方法有一个关键的挑战:优化编码器中潜在表示的比特率R,为了使用数量有限的比特对图像进行编码,需要将潜在的表示离散化映射到有限值的集合。而离散化是不可微的,这就给基于梯度的优化方法带
阅读全文
摘要:拿到一个服务器很迷茫,不知道如何使用,写一份本实验室的服务器使用方法: 1下载Xshell和Xftp 现在提供了家庭/学习免费版 2安装后新建会话 3 bash命令 切换到bash界面 bash,全称Bourne Again Shell,是绝大多数Linux系统默认的命令解释器,能够处理用户所输入的
阅读全文
摘要:abstruct 现在的可学习图像远超过去的手工方法,成功的原因在于可学习熵模型能够预测量化浅表示的概率分布。由于CNN局部连接的特性,在建模远程依赖关系的方面存在局限性。而在图像压缩中,减少空间冗余是非常重要的,因此在该领域CNN出现瓶颈。 为克服该问题,该文章
阅读全文
摘要:详细梳理熵编码 熵编码即编码过程中按熵原理不丢失任何信息的无损编码方式,同时在有损编码中的出现,作为编码器的最后一个流程。 信息熵为信源的平均信息量(不确定性的度量)。常见的熵编码有:香农(Shannon)编码、哈夫曼(Huffman)编码,指数哥伦布编码(Exp
阅读全文
摘要:目录AbstractIntroductionPreliminary 初步介绍Variational Image Compression with Hyperprior(超先验变分图像压缩)Autoregressive Context(自回归上下文模型)Parallel Context Modelin
阅读全文
摘要:在图像处理和视频编解码中,"rate-distortion"是一种用于描述编码压缩效率的概念。它涉及到编码的比特率(rate)和图像质量损失(distortion)之间的平衡。在这个概念中,"rate"指的是编码所需的比特率,也称潜在表示的熵,而"distortion"则表示由于压缩引起的图像质量损
阅读全文
摘要:基于神经网络视频和图形压缩技术的发展 简介压缩方法的发展,然后分别讲述了图像压缩和视频压缩的技术发展。 图像压缩方法的发展 早期直接使用熵编码减少图像的统计冗余(例如哈弗曼编码)。 1960s 提出变换编码,通过对空间频率进行编码来压缩图像,(例如傅里叶变换)。 1974离散余弦变换(Discret
阅读全文
摘要:(暂不关注写作技巧和谋篇布局,前期主要针对相关知识进行学习。 2023.12.16 陈龙) 使用某种压缩方法,比JPEG更好的失真率。而且在所有比特率下视觉质量明显改善(MS-SSIM) Introduction 数据压缩的目标是为给定数据集合设计熵最小的编码。在有限熵的条件下,连续数据必须量化为有
阅读全文
摘要:流形是指连在一起的区域:是一组点的集合,且每个点都有邻域。(也就意味着流形中某个元素可以通过某种方式移动到其邻域位置) 在机器学习中,我们允许流形的维数从一个点到另一个点有所变化。(这通常发生在流形与自身相交的情况。例如数字8,流形大多数位置只有一维,但在中心相交的时候,可移动方向变成两维)。 流形
阅读全文
摘要:七、正则化(Regularization) 7.1 过拟合的问题 线性回归和逻辑回归能够有效地解决许多问题,但是当将它们应用到某些特定的机器学习场景时,会遇到过拟合(over-fitting)的问题,可能会导致它们效果很差。因此,我们需要一种正则化(regularization)的技术,它可以改善或
阅读全文
摘要:4.1 多维特征 现在我们对房价模型增加更多的特征,例如房间数楼层等,构成一个含有多个变量的模型,模型中的特征为(x1,x2,x3,....,xn). 因此,用n表示特征的数量,用x(i)j 表示第i个实例的第j个特征。 则支持多变量的假设h可表示为:h(x(i))=sita0+sita1*x(i)
阅读全文
摘要:3.1 矩阵和向量 这一节对矩阵和向量的概念进行描述,不再赘述。 3.2 加法和标量乘法 矩阵和矩阵的加法:对应元素相加 矩阵和标量乘法:矩阵的每个元素都与标量相乘 3.3 矩阵向量乘法 以及 3.4 矩阵乘法 都可以看作是矩阵乘法,第i行乘第j列,对应元素相乘再相加,然后放到结果矩阵的第i行第j列
阅读全文
摘要:2.1 模型表示 本节将通过线性回归来了解监督学习的过程: 对于房价预测模型,我们之所以将其称为监督学习(因为对每个数据都有一个正确答案-真实的房价)。由于房价是一些连续的值,因此这是一个回归问题。 h代表学习算法的解决方案或函数也称为假设(hypothesis),监督学习算法的工作方式如下 要解决
阅读全文
摘要:1.2 机器学习是什么? Arthur Samuel:他定义机器学习为,在进行特定编程的情况下,给予计算机学习能力的领域。 Tom(卡内基梅隆大学)定义的机器学习是,一个好的学习问题定义如下,一个程序被认为能从经验E中学习,解决任务T,达到性能度量值P,当且仅当有了经验E后,经过P评判,程序在处理T
阅读全文
摘要:15.1. 情感分析及数据集 情感分析(sentiment analysis)研究人们在文本中 (如产品评论、博客评论和论坛讨论等)“隐藏”的情绪。由于情感可以被分类为离散的极性或尺度(例如,积极的和消极的),我们可以将情感分析看作一项文本分类任务,它将可变长度的文本序列转换为固定长度的文本类别。
阅读全文
摘要:14.1. 词嵌入(word2vec) 词向量是用于表示单词意义的向量, 并且还可以被认为是单词的特征向量或表示。 将单词映射到实向量的技术称为词嵌入。然独热向量很容易构建,但它们通常不是一个好的选择。一个主要原因是独热向量不能准确表达不同词之间的相似度,比如我们经常使用的“余弦相似度”,任意两个词
阅读全文
摘要:在定义模型时,很多python的代码里的开始会有super().__init__(),它有什么作用? super()用来调用父类(基类)的方法。这样,子类中可以不必重复定义某些函数,直接调用父类的即可。 __init__()是类的构造方法,存放在创建对象时会自动执行的语句。 super().__in
阅读全文
摘要:本以为从谷歌硬盘打开的.ipynb可以直接自动调用同目录下的文件(因为之前在本地是这样做的),但是在运行时总报错 "No such file or directory: '../img/catdog.jpg' "我就很懵,是不是因为colab实验室自己没有没有访问硬盘的权限呢? 然后加上如下代码,运
阅读全文
摘要:本章将重点介绍计算机视觉领域,并探讨最近在学术界和行业中具有影响力的方法和应用。 13.1. 图像增广 图像增广在对训练图像进行一系列的随机变化之后,生成相似但不同的训练样本,从而扩大了训练集的规模。随机改变训练样本可以减少模型对某些属性的依赖,从而提高模型的泛化能力。 例如,我们可以以不同的方式裁
阅读全文