03 2024 档案

摘要:RD性能: 结合图像重压缩的MLCC模型以及 自编码器中的注意力机制 The Devil Is in the Details: Window-based Attention for Image Compression(全注意力机制 可以换成ViT) Joint Global and Local Hi 阅读全文
posted @ 2024-03-31 15:40 浪矢-CL 阅读(22) 评论(0) 推荐(0) 编辑
摘要:目录简介创新点内容Entropy Coding Using Multistage Context Model模型结构残差邻域注意力块Residual Neighborhood Attention Block RNAB激活函数 高斯误差线性单元激活函数GELU多阶段上下文模型 (MCM)并行解码 简介 阅读全文
posted @ 2024-03-31 14:53 浪矢-CL 阅读(89) 评论(0) 推荐(0) 编辑
摘要:目录简介创新点模型框架信道条件熵模型实验&结果 简介 熵约束自动编码器的熵模型同时使用前向适应和后向适应。 前向自适应利用边信息,可以被有效加入到深度网络中。 后向自适应通常基于每个符号的因果上下文进行预测,这需要串行处理,这妨碍了GPU / TPU的有效利用。 创新点 本文引入两个增强模块,通道调 阅读全文
posted @ 2024-03-29 16:17 浪矢-CL 阅读(102) 评论(0) 推荐(0) 编辑
摘要:目录传统方法的局限性端到端的基于学习的方法熵编码过程 传统方法的局限性 传统的方法基于分割的图像块,会产生伪影。 编码器的各个组件之间依赖关系复杂,难以手动进行整体优化。 单个模块得到较大提升后,模型整体可能不会有太大提高。 端到端的基于学习的方法 对模型整体进行联合优化,对单个组件的改进会影响模型 阅读全文
posted @ 2024-03-23 16:16 浪矢-CL 阅读(58) 评论(0) 推荐(0) 编辑
摘要:目录简介Nvidia驱动和cudatoolKit下载引导检验命令pytorch(最好使用wheel)pycharm添加解释器环境 简介 首先我们要下载的东西包括: anaconda(虚拟环境管理) pycharm(代码 项目编辑器) Nvidia驱动和CUDAtoolKit(CUDA就是由CUDA驱 阅读全文
posted @ 2024-03-21 17:05 浪矢-CL 阅读(79) 评论(0) 推荐(0) 编辑
摘要:通常我们需要去估计某符号出现的条件概率: P(Y|X)=P(X|Y)P(Y)P(Y) 例如,在一个评分预测中,我想得到对某个序列的评分的概率。 如图 如果我想知道item4各个标签出现的概率,那么需要先计算item4条件下其他符号出现的概率P(X|item4)以及item 阅读全文
posted @ 2024-03-19 10:49 浪矢-CL 阅读(18) 评论(0) 推荐(0) 编辑
摘要:目录简介创新点模型设置CCCM compressed checkerboard context modelPPCM pipeline parallel context modelShift Context实验设置结果 简介 本文是GuoLina以及HeDailan商汤团队关于重压缩的第二篇论文,这次 阅读全文
posted @ 2024-03-15 16:17 浪矢-CL 阅读(34) 评论(0) 推荐(0) 编辑
摘要:目录简介模型DCT Coefficients Rearrangement 将系数重排Cross-Color Entropy ModelMatrix Context ModelMulti-Level Cross-Channel Entropy Model创新点实验设置训练数据集:测试数据集:训练细节: 阅读全文
posted @ 2024-03-12 19:42 浪矢-CL 阅读(104) 评论(0) 推荐(0) 编辑
摘要:目录简介 简介 JPEG算法首先将RGB源图像转换为YCbCr色彩空间(一个亮度分量(Y)和两个色度分量(Cb和Cr))(RGB图像模式与YCbCr彩色空间的关系见上一篇文章) 大多数JPEG图像采用YCbCr 4:2:0格式,其中Y保持相同的分辨率,而Cb和Cr分量被下采样为其原始分辨率的1/4 阅读全文
posted @ 2024-03-06 14:35 浪矢-CL 阅读(30) 评论(0) 推荐(0) 编辑
摘要:直接对原始图像进行压缩的研究非常成熟,但是对JPEG等服务器上数据进行重压缩的文章似乎很少,其实两者的目的都是去消除图像中的冗余信息。那么似乎我可以在图像压缩研究的基础上,探索如何在二次压缩时消除图像中的冗余信息。 这是第一篇基于深度学习的图像重压缩文章Practical Lear 阅读全文
posted @ 2024-03-05 16:04 浪矢-CL 阅读(26) 评论(0) 推荐(0) 编辑
摘要:目录RGBYUVYCbCr RGB RGB图像具有三个通道R、G、B,分别对应红、绿、蓝三个分量,由三个分量的值决定颜色;通常,会给RGB图像加一个通道alpha,即透明度,于是共有四个分量共同控制颜色。 那么对于一张1920 * 1080的图片,如果采用RGBA编码格式,这一张图片加载到内存并在设 阅读全文
posted @ 2024-03-04 17:22 浪矢-CL 阅读(3941) 评论(0) 推荐(0) 编辑
摘要:目录简介原理介绍 简介 先说结论:JPEG中的质量参数允许取1~100间的任意一个整数。质量取得越大,压缩比就越低,压缩后的图像文件占用空间就越大,压缩后的图像与原图的相似度就越高,甚至当质量取100时,JPEG就变成了无损压缩算法。 原理介绍 量化表是固定的,亮度(Y)和色度(Cb、Cr)矩阵需要 阅读全文
posted @ 2024-03-04 15:37 浪矢-CL 阅读(1021) 评论(0) 推荐(0) 编辑
摘要:打开 .png 格式的图像时,计算机会进行以下步骤: 读取文件头:计算机首先读取图像文件的文件头,确定这是一个 .png 格式的文件。 解析图像数据:计算机会解析图像数据块,这些数据块包含了图像的像素信息、色彩类型、图像尺寸等。这些数据块的格式和内容在 PNG 规范中有详细定义。 解压缩数据:PNG 阅读全文
posted @ 2024-03-03 14:49 浪矢-CL 阅读(20) 评论(0) 推荐(0) 编辑
摘要:本地图像在上传服务器时,由于所占存储空间比较大,一般会进行压缩上传: 一般分为前端压缩和后端压缩。 前端压缩:在上传之前在客户端的进行压缩,然后再上传。 后端压缩:在服务器端接收到上传的图片后,在服务器端对图片进行压缩。 通常进行先进行前端压缩,然后如果图像仍然太大,则会进行二次压缩。 那么上传时的 阅读全文
posted @ 2024-03-01 16:23 浪矢-CL 阅读(41) 评论(0) 推荐(0) 编辑

点击右上角即可分享
微信分享提示