会员
周边
众包
新闻
博问
闪存
赞助商
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
躺柒
博客园
首页
新随笔
联系
订阅
管理
随笔 - 787
文章 - 0
评论 - 17
阅读 -
49008
读数据压缩入门笔记08_评价数据压缩
数据压缩评价
合集 - 读数据压缩入门(11)
1.
读数据压缩入门笔记
01_数据压缩导读
2023-05-29
2.
读数据压缩入门笔记
02_二进制和熵
2023-05-30
3.
读数据压缩入门笔记
03_VLC
2023-05-31
4.
读数据压缩入门笔记
04_统计编码
2023-06-07
5.
读数据压缩入门笔记
05_字典转换
2023-06-16
6.
读数据压缩入门笔记
06_上下文转换
2023-06-17
7.
读数据压缩入门笔记
07_自适应统计编码
2023-07-15
8.
读数据压缩入门笔记
08_评价数据压缩
2023-07-22
9.
读数据压缩入门笔记
09_多媒体数据压缩
2023-07-23
10.
读数据压缩入门笔记
10_通用压缩和序列化
2023-07-24
11.
读数据压缩入门笔记
11_读后总结与感想兼导读
2023-07-26
1. 并不是每个算法都适用于所有的使用场景
2. 关注点
2.1. 数据是在哪里压缩、存储和解压的
2.2. 数据是从哪里来的、到哪里去
3. 数据压缩的使用场景
3.1. 线下压缩,客户端解压
3.1.1. 打包的应用程序或者电子游戏
3.1.2. 艺术家创作并共享他们的作品
3.1.3. 原始的作品都是使用高分辨率、高保真的工具制作的,然后再输出并压缩以供分发
3.1.4. 目的是使多媒体文件尽可能地小
3.1.5. 权衡取舍的是多媒体文件的品质
3.2. 客户端压缩,云端解压
3.2.1. 在客户端进行初步压缩,以节省出站通信的流量费用
3.2.2. 目的是减少用户的费用
3.2.3. 权衡取舍是对于移动设备,需要消耗电池的电量去压缩数据
3.3. 云端压缩,客户端解压
3.3.1. 由云端资源生成的动态数据
3.3.1.1. 在客户端请求数据库操作的结果
3.3.1.2. 服务器发送了动态布局的数据
3.3.1.3. 平衡压缩后的大小与所需要的时间
3.3.1.4. 目的就是让通过网络传输的内容变得更小
3.3.1.5. 权衡取舍的是时间
3.3.2. 为提高计算效率而传输到云端的大量数据
3.3.2.1. 需要确保手边的媒体文件尽量地小
3.3.2.2. 由云端传输出去的每个二进制位都需要所有者付费
3.3.2.3. 客户端也需要为从云端获取的每个二进制位付费
3.3.2.4. 目标就是高效地将大量的数据压缩为最少的二进制位数
3.3.2.5. 权衡取舍的是成本和效率(也就是计算资源的价格)
3.4. 客户端压缩,客户端解压
3.4.1. 客户端应用程序相互之间需要通信
3.4.2. 难点是客户端通常是移动设备,没有优化转换和压缩数据所需要的大量资源
3.4.3. 需要权衡设备的功能、压缩和解压需要的时间以及需要数据的迫切性
4. 数据压缩的需求
4.1. 对图像数据应用哈夫曼编码,那么压缩的结果肯定达不到应用有损图像压缩算法的水平
4.2. 与全屏显示的图片相比,缩略图对图片质量的要求就会比较低
4.2.1. 缩略图可以使用有损的JPEG编码压缩
4.2.2. 对质量有更高要求的图片则应该使用无损的WebP编解码器编码
4.3. 了解要处理的数据
4.3.1. 数据的类型
4.3.2. 内部结构
4.3.3. 使用方式
4.4. 了解算法的各项指标
4.4.1. 选出正确的算法系列
4.5. 了解在给定的情况下你需要的是什么
4.5.1. 有些算法能节省特别多的空间
5. 压缩率
5.1. 最重要的指标
5.2. 内容压缩后的大小与压缩前大小之比
5.3. 压缩的最主要目的就是让数据变得最紧凑,在网络传输中二进制位数总是越少越好
5.4. 1GB的文本文件,用ZPAQ算法压缩,压缩后的文件通常会最小,但同时需要2GB的内存以及3个小时才能在台式计算机上完成压缩,解压时需要的资源时间大致相同
5.4.1. 当关注的主要是压缩后的文件大小时,ZPAQ算法是很不错,但它不适用于在移动设备上压缩数据
5.5. 对那些在线下或者云端进行压缩的服务来说,压缩率就是最重要的考虑因素
5.5.1. 有资源、有时间将数据压缩得最小,同时这样做还能减少传输数据所需的费用
6. 压缩性能
6.1. 将数据转换为压缩后的形式需要多长时间
6.2. 评价指标
6.2.1. CPU速度
6.2.1.1. 决定了数据可以压缩得多快
6.2.2. 内存
6.2.2.1. 它十分有限,特别是对移动设备来说
7. 解压性能
7.1. 对所有重点关注性能的环境来说,解压速度的重要性超过其他所有指标
7.2. 选择压缩算法主要是根据该算法的解压性能而不是压缩后文件的大小
7.3. 那些能将文件压缩得最小的算法,通常也需要花最长的时间去解压
7.4. GZIP之所以成为当前世界上使用较多的通用文档压缩算法,解码性能是其中最主要的原因之一
7.4.1. GZIP算法生成的压缩文件大小合适且解压速度很快,这使得它适用于各种类型的嵌入式设备和非嵌入式设备
8. 解码流的能力
8.1. 数据流通常是解压时容易被忽略的一个方面
8.2. 完整的数据包
8.2.1. 解码前所有的数据都必须在内存中
8.3. 数据以分块的形式发送到客户端,一到客户端就开始解码(即分块解码)
9. 比较压缩算法
9.1. Squash压缩基准测试
9.1.1. 测试各种算法在压缩XML、文本、图像以及其他数据格式时的表现
9.2. Squeeze Chart
9.2.1. 比较算法在压缩各种文本、音频以及位图时的表现
9.3. 不同的算法和不同的设置,都会影响到开发的应用程序的压缩质量
合集:
读数据压缩入门
好文要顶
关注我
收藏该文
微信分享
躺柒
粉丝 -
50
关注 -
0
+加关注
0
0
升级成为会员
«
上一篇:
选读SQL经典实例笔记11_结果集变换
»
下一篇:
读数据压缩入门笔记09_多媒体数据压缩
posted @
2023-07-22 07:06
躺柒
阅读(
62
) 评论(
0
)
编辑
收藏
举报
刷新页面
返回顶部
登录后才能查看或发表评论,立即
登录
或者
逛逛
博客园首页
【推荐】还在用 ECharts 开发大屏?试试这款永久免费的开源 BI 工具!
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】凌霞软件回馈社区,博客园 & 1Panel & Halo 联合会员上线
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】博客园社区专享云产品让利特惠,阿里云新客6.5折上折
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
相关博文:
·
读数据压缩入门笔记09_多媒体数据压缩
·
读数据压缩入门笔记01_数据压缩导读
·
聊聊数据压缩
·
[数据压缩] 压缩算法概述
·
如何压缩数据?
阅读排行:
·
一个费力不讨好的项目,让我损失了近一半的绩效!
·
清华大学推出第四讲使用 DeepSeek + DeepResearch 让科研像聊天一样简单!
·
实操Deepseek接入个人知识库
·
CSnakes vs Python.NET:高效嵌入与灵活互通的跨语言方案对比
·
Plotly.NET 一个为 .NET 打造的强大开源交互式图表库
公告
昵称:
躺柒
园龄:
2年1个月
粉丝:
50
关注:
0
+加关注
<
2025年2月
>
日
一
二
三
四
五
六
26
27
28
29
30
31
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
1
2
3
4
5
6
7
8
搜索
常用链接
我的随笔
我的评论
我的参与
最新评论
我的标签
合集
学信息系统项目管理师第4版(35)
学系统集成项目管理工程师(中项)(43)
读高性能MySQL(第4版)(21)
读发布!设计与部署稳定的分布式系统(第2版)(34)
随笔及总结(26)
读改变未来的九大算法(10)
读数据压缩入门(11)
读C#代码整洁之道(8)
读编程与类型系统(12)
读函数式编程思维(6)
读Java8函数式编程(9)
读Java实战(第二版)(20)
读Java性能权威指南(第2版)(31)
读SQL进阶教程(17)
选读SQL经典实例(23)
读SQL学习指南(第3版)(13)
读图数据库实战(11)
读程序员的制胜技(15)
读像火箭科学家一样思考(16)
读程序员的README(19)
读算法霸权(13)
读元宇宙改变一切(14)
读AI3.0(10)
读千脑智能(13)
读十堂极简人工智能课(9)
读人工不智能:计算机如何误解世界(10)
读算法的陷阱:超级平台、算法垄断与场景欺骗(20)
读所罗门的密码(21)
读天才与算法:人脑与AI的数学思维(26)
读人工智能时代与人类未来(19)
读AI未来进行式(12)
读AI新生:破解人机共存密码(18)
读人工智能全传(16)
读写给大家的AI极简史(7)
读零信任网络:在不可信网络中构建安全系统(21)
读软件开发安全之道:概念、设计与实施(17)
读软件设计的要素(7)
读构建可扩展分布式系统:方法与实践(16)
读数据湖仓(9)
读数据工程之道:设计和构建健壮的数据系统(34)
读数据质量管理:数据可靠性与数据质量问题解决之道(20)
读数据保护:工作负载的可恢复性(31)
读量子霸权(18)
读算法简史:从美索不达米亚到人工智能时代(15)
读当我点击时,算法在想什么?(7)
读DAMA数据管理知识体系指南(3)
更多
随笔档案
2025年2月(24)
2025年1月(31)
2024年12月(31)
2024年11月(30)
2024年10月(31)
2024年9月(30)
2024年8月(31)
2024年7月(31)
2024年6月(30)
2024年5月(31)
2024年4月(30)
2024年3月(31)
2024年2月(29)
2024年1月(31)
2023年12月(31)
2023年11月(30)
2023年10月(31)
2023年9月(30)
2023年8月(31)
2023年7月(31)
2023年6月(30)
2023年5月(31)
2023年4月(31)
2023年3月(36)
2023年2月(28)
2023年1月(26)
阅读排行榜
1. C#代码整洁之道读后总结与感想(599)
2. 选读SQL经典实例笔记01_检索和排序(369)
3. 读C#代码整洁之道笔记01_C#的编码标准和原则(311)
4. 读C#代码整洁之道笔记04_重构C#代码识别代码坏味道(309)
5. 学信息系统项目管理师第4版系列02_法律法规(268)
评论排行榜
1. 2023年1月随笔(11)
2. 2023年10月随笔之婚宴趣事多(2)
3. 读高性能MySQL(第4版)笔记12_查询性能优化(下)(2)
4. 读Java性能权威指南(第2版)笔记18_垃圾回收E(2)
推荐排行榜
1. 读高性能MySQL(第4版)笔记01_MySQL架构(上)(2)
2. 选读SQL经典实例笔记01_检索和排序(2)
3. 读软件设计的要素01概念(1)
4. 读AI未来进行式笔记01深度学习(1)
5. 读所罗门的密码笔记01_当人类遇见机器(1)
最新评论
1. Re:2023年10月随笔之婚宴趣事多
@gz4621 wondershare mindmaster...
--躺柒
2. Re:2023年10月随笔之婚宴趣事多
大神 思维导图用的什么软件制作的?
--gz4621
3. Re:读高性能MySQL(第4版)笔记12_查询性能优化(下)
@东围居士 建议读新版。...
--躺柒
4. Re:读高性能MySQL(第4版)笔记12_查询性能优化(下)
第4版相比第3版好像缩减了好多内容?楼主推荐第3版还是第4版
--东围居士
5. Re:读Java性能权威指南(第2版)笔记18_垃圾回收E
@屠炉 没有用第三方工具,手动的。 有几个平台直接支持markdown导入,只是要调整一下图片上传即可。...
--躺柒
点击右上角即可分享
支持DeepSeek的编程助手
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】凌霞软件回馈社区,博客园 & 1Panel & Halo 联合会员上线
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】博客园社区专享云产品让利特惠,阿里云新客6.5折上折
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· 一个费力不讨好的项目,让我损失了近一半的绩效!
· 清华大学推出第四讲使用 DeepSeek + DeepResearch 让科研像聊天一样简单!
· 实操Deepseek接入个人知识库
· CSnakes vs Python.NET:高效嵌入与灵活互通的跨语言方案对比
· Plotly.NET 一个为 .NET 打造的强大开源交互式图表库