随笔分类 -  深度学习

摘要:目录简介引入文章贡献对 DCT 系数残差进行编码比对原始 DCT 系数进行编码更有利于压缩模型框架模型的应用场景null 简介 JPEG图像编码格式由于其简单高效在各种设备和网站上被广泛使用,随着互联网的发展和移动设备的普及大量用户生成的JPEG图像被上传到各社交网站或者储存在个人 阅读全文
posted @ 2024-10-25 17:28 浪矢-CL 阅读(93) 评论(0) 推荐(0) 编辑
摘要:目录优势原理人对亮度信息更为敏感人对高频信号并不敏感 优势 DCT变换可以将高频信号与低频信号分开,从而在压缩时将下三角区域的高频信号进行更充分的压缩(其实就是进行更离散的量化) 原理 人对亮度信息更为敏感 首先将RGB格式转化为YCbCr格式,做DCT变换(这是为了便于分别对亮度和色度分量进行处理 阅读全文
posted @ 2024-05-15 11:39 浪矢-CL 阅读(317) 评论(0) 推荐(0) 编辑
摘要:RD性能: 结合图像重压缩的MLCC模型以及 自编码器中的注意力机制 The Devil Is in the Details: Window-based Attention for Image Compression(全注意力机制 可以换成ViT) Joint Global and Local Hi 阅读全文
posted @ 2024-03-31 15:40 浪矢-CL 阅读(22) 评论(0) 推荐(0) 编辑
摘要:目录简介创新点内容Entropy Coding Using Multistage Context Model模型结构残差邻域注意力块Residual Neighborhood Attention Block RNAB激活函数 高斯误差线性单元激活函数GELU多阶段上下文模型 (MCM)并行解码 简介 阅读全文
posted @ 2024-03-31 14:53 浪矢-CL 阅读(89) 评论(0) 推荐(0) 编辑
摘要:目录简介创新点模型框架信道条件熵模型实验&结果 简介 熵约束自动编码器的熵模型同时使用前向适应和后向适应。 前向自适应利用边信息,可以被有效加入到深度网络中。 后向自适应通常基于每个符号的因果上下文进行预测,这需要串行处理,这妨碍了GPU / TPU的有效利用。 创新点 本文引入两个增强模块,通道调 阅读全文
posted @ 2024-03-29 16:17 浪矢-CL 阅读(102) 评论(0) 推荐(0) 编辑
摘要:目录传统方法的局限性端到端的基于学习的方法熵编码过程 传统方法的局限性 传统的方法基于分割的图像块,会产生伪影。 编码器的各个组件之间依赖关系复杂,难以手动进行整体优化。 单个模块得到较大提升后,模型整体可能不会有太大提高。 端到端的基于学习的方法 对模型整体进行联合优化,对单个组件的改进会影响模型 阅读全文
posted @ 2024-03-23 16:16 浪矢-CL 阅读(58) 评论(0) 推荐(0) 编辑
摘要:目录简介Nvidia驱动和cudatoolKit下载引导检验命令pytorch(最好使用wheel)pycharm添加解释器环境 简介 首先我们要下载的东西包括: anaconda(虚拟环境管理) pycharm(代码 项目编辑器) Nvidia驱动和CUDAtoolKit(CUDA就是由CUDA驱 阅读全文
posted @ 2024-03-21 17:05 浪矢-CL 阅读(79) 评论(0) 推荐(0) 编辑
摘要:通常我们需要去估计某符号出现的条件概率: P(Y|X)=P(X|Y)P(Y)P(Y) 例如,在一个评分预测中,我想得到对某个序列的评分的概率。 如图 如果我想知道item4各个标签出现的概率,那么需要先计算item4条件下其他符号出现的概率P(X|item4)以及item 阅读全文
posted @ 2024-03-19 10:49 浪矢-CL 阅读(18) 评论(0) 推荐(0) 编辑
摘要:目录简介创新点模型设置CCCM compressed checkerboard context modelPPCM pipeline parallel context modelShift Context实验设置结果 简介 本文是GuoLina以及HeDailan商汤团队关于重压缩的第二篇论文,这次 阅读全文
posted @ 2024-03-15 16:17 浪矢-CL 阅读(34) 评论(0) 推荐(0) 编辑
摘要:目录简介模型DCT Coefficients Rearrangement 将系数重排Cross-Color Entropy ModelMatrix Context ModelMulti-Level Cross-Channel Entropy Model创新点实验设置训练数据集:测试数据集:训练细节: 阅读全文
posted @ 2024-03-12 19:42 浪矢-CL 阅读(104) 评论(0) 推荐(0) 编辑
摘要:目录简介 简介 JPEG算法首先将RGB源图像转换为YCbCr色彩空间(一个亮度分量(Y)和两个色度分量(Cb和Cr))(RGB图像模式与YCbCr彩色空间的关系见上一篇文章) 大多数JPEG图像采用YCbCr 4:2:0格式,其中Y保持相同的分辨率,而Cb和Cr分量被下采样为其原始分辨率的1/4 阅读全文
posted @ 2024-03-06 14:35 浪矢-CL 阅读(30) 评论(0) 推荐(0) 编辑
摘要:直接对原始图像进行压缩的研究非常成熟,但是对JPEG等服务器上数据进行重压缩的文章似乎很少,其实两者的目的都是去消除图像中的冗余信息。那么似乎我可以在图像压缩研究的基础上,探索如何在二次压缩时消除图像中的冗余信息。 这是第一篇基于深度学习的图像重压缩文章Practical Lear 阅读全文
posted @ 2024-03-05 16:04 浪矢-CL 阅读(26) 评论(0) 推荐(0) 编辑
摘要:目录RGBYUVYCbCr RGB RGB图像具有三个通道R、G、B,分别对应红、绿、蓝三个分量,由三个分量的值决定颜色;通常,会给RGB图像加一个通道alpha,即透明度,于是共有四个分量共同控制颜色。 那么对于一张1920 * 1080的图片,如果采用RGBA编码格式,这一张图片加载到内存并在设 阅读全文
posted @ 2024-03-04 17:22 浪矢-CL 阅读(3941) 评论(0) 推荐(0) 编辑
摘要:目录简介原理介绍 简介 先说结论:JPEG中的质量参数允许取1~100间的任意一个整数。质量取得越大,压缩比就越低,压缩后的图像文件占用空间就越大,压缩后的图像与原图的相似度就越高,甚至当质量取100时,JPEG就变成了无损压缩算法。 原理介绍 量化表是固定的,亮度(Y)和色度(Cb、Cr)矩阵需要 阅读全文
posted @ 2024-03-04 15:37 浪矢-CL 阅读(1021) 评论(0) 推荐(0) 编辑
摘要:本地图像在上传服务器时,由于所占存储空间比较大,一般会进行压缩上传: 一般分为前端压缩和后端压缩。 前端压缩:在上传之前在客户端的进行压缩,然后再上传。 后端压缩:在服务器端接收到上传的图片后,在服务器端对图片进行压缩。 通常进行先进行前端压缩,然后如果图像仍然太大,则会进行二次压缩。 那么上传时的 阅读全文
posted @ 2024-03-01 16:23 浪矢-CL 阅读(41) 评论(0) 推荐(0) 编辑
摘要:目录安装pytorch环境首先使用conda创建新环境(python和cuda版本根据自己服务器类型选择)然后在新环境安装相应版本的pytoch,(可去官网查找安装命令)https://pytorch.org安装教程遇到的问题下载compressai 安装pytorch环境 首先使用conda创建新 阅读全文
posted @ 2023-12-30 20:33 浪矢-CL 阅读(955) 评论(0) 推荐(0) 编辑
摘要:在安装compressai的时候,想用它自带的setup.py把相应库安装好,但是需要先下载pybind11 下载时遇到如下问题: ERROR: Could not install packages due to an OSError: [Errno 2] No such file or direc 阅读全文
posted @ 2023-12-29 21:28 浪矢-CL 阅读(380) 评论(0) 推荐(0) 编辑
摘要:目录简介创新之处模型结构实验结果 什么是Quantization-Aware量化感知? 简介 该文章基于VAE提出一种多层次的图像压缩方法 专门设计了用于快速解码(CPU)的QARV网络结构,并为可变速率压缩提出自适应归一化操作。 创新之处 提出了一个算法模型,实现了更快的解码速度和更好的R-D性能 阅读全文
posted @ 2023-12-27 17:00 浪矢-CL 阅读(282) 评论(0) 推荐(0) 编辑
摘要:#开局命令 bash conda activate checkb nohup python examples/train.py -m cheng2020-attn -d/home/user3/compressai/examples/data2 --epochs 400 -lr 1e-4 --batc 阅读全文
posted @ 2023-12-20 17:07 浪矢-CL 阅读(6) 评论(0) 推荐(0) 编辑
摘要:熵模型 论文<VARIATIONAL IMAGE COMPRESSION WITH A SCALE HYPERPRIOR 提出使用超先验,来捕获潜在表示的超先验。 追根溯源发现:在香农的通信理论中给出数学解释 即,使用联合分布比独立分布更优 如果有先验的信息,对后续编码而言其不确定性会更小,从而获得 阅读全文
posted @ 2023-11-26 21:17 浪矢-CL 阅读(83) 评论(0) 推荐(0) 编辑

点击右上角即可分享
微信分享提示