随笔分类 -  文本压缩

稀疏数据压缩查询方法:Rank & Select 操作
摘要:1.稀疏数据的例子 对于网络图对应的节点关联矩阵、数据生成的哈希表等,这些存储起来是稀疏的,这样我们就会想到需要压缩空间。但是在压缩存储空间的同时,还要支持高效的查询操作。 Rank & Select 就可以对稀疏的数据进行压缩,还能支持高效的查询操作。2.Rank & Select 操作压缩稀... 阅读全文

posted @ 2014-06-14 11:28 旭东的博客 阅读(2897) 评论(0) 推荐(0) 编辑

BWT (Burrows–Wheeler_transform)数据转换算法
摘要:1.什么是BWT 压缩技术主要的工作方式就是找到重复的模式,进行紧密的编码。 BWT(Burrows–Wheeler_transform)将原来的文本转换为一个相似的文本,转换后使得相同的字符位置连续或者相邻,之后可以使用其他技术如:Move-to-front transform和游程编码进行文... 阅读全文

posted @ 2014-06-03 15:59 旭东的博客 阅读(28817) 评论(1) 推荐(1) 编辑

MTF(Move-to-front transform)数据转换
摘要:1.什么是MTF MTF(move-to-front)是一种数据编码方式,用于提高数据压缩技术效果。 在数据压缩算法中,MTF可以作为一个额外的步骤。也就是说 ,可以先进行MTF编码,在进行数据压缩。2.MTF基本原理 主要使用的是数据的”空间局部性“,也就是最近出现过的字符很可能在接下来的文... 阅读全文

posted @ 2014-06-02 11:22 旭东的博客 阅读(8070) 评论(0) 推荐(0) 编辑

基于统计的压缩算法:游程编码
摘要:1.游程编码概念 游程编码又称“运行长度编码”或“行程编码”,是一种统计编码,该编码属于无损压缩编码。2.基本原理 用一个符号值和串长代替具有相同值的连续符号,使符号长度少于原始数据的长度。 如: 原始文本:dfffffeeeeettttrrrrttttt 游程编码后文本:d1f5e... 阅读全文

posted @ 2014-06-01 22:11 旭东的博客 阅读(8456) 评论(0) 推荐(1) 编辑

导航

< 2025年3月 >
23 24 25 26 27 28 1
2 3 4 5 6 7 8
9 10 11 12 13 14 15
16 17 18 19 20 21 22
23 24 25 26 27 28 29
30 31 1 2 3 4 5
点击右上角即可分享
微信分享提示