随笔分类 -  第六章亲自尝试压缩数据

摘要:图像文件的使用目的通常把图像数据输出到显示器、打印机等设备上。Windws的标准图像形式为BMP,是完全未压缩的。由于显示器及打印机输出的bit(点)是可以直接映射(mapping)的,因此便有了BMP=bitmap这一名称。 除BMP格式以外,还有其他各种格式的图像数据形式。比如JPEG格式、TL 阅读全文
posted @ 2023-02-12 19:02 原魏薯片 阅读(194) 评论(0) 推荐(0) 编辑
摘要:通过前面我们看到的图6-5的步骤2可以发现,在用枝条连接数据时,我们是从出现频率较低的数据开始的,这就意味着出现频率越低 的数据到达根部的枝条就越多。而枝条越多,编码的位数也就随之增多了。 而从哈夫曼算法压缩过的文件中读取数据后,就会以位为单位对该数据进行排查,并与哈夫曼树进行比较看是否到达了目标编 阅读全文
posted @ 2023-02-12 18:42 原魏薯片 阅读(28) 评论(0) 推荐(0) 编辑
摘要:莫尔斯编码是根据日常文本中各字符出现频率决定表示各字符的编码的数据长度。不过,该编码体系,对AAAAAABBCDDEEEEEEF这样的特殊文并不是最合适的。在莫尔斯编码中,E的数据长度最短,而在AAAAAABBCDDEEEEEEF这个文本中,出现最频繁的是字符A。因此,应该给A分配数据长度最短的编码 阅读全文
posted @ 2023-02-12 18:29 原魏薯片 阅读(42) 评论(0) 推荐(0) 编辑
摘要:哈夫曼算法是哈夫曼(D.A.Huffman)于1952年提出来的压缩算法。日本人比较常用的压缩软件LHA,使用的就是哈夫曼算法。 文本文件是由不同类型的字符组合而成的,而且不同的字符出现的次数也是不同的。例如,在某以文本文件中,A出现了100次左右,Q仅用到了3次,类似这样的情况是很常见的。而哈夫曼 阅读全文
posted @ 2023-02-12 16:46 原魏薯片 阅读(56) 评论(0) 推荐(0) 编辑
摘要:在实际的文本文件中,同样字符多次重复出现的情况并不多见。虽然针对相同数据经常连续出现的图像、文件等,RLE算法可以发挥不错的效果,但它并不适合文本文件 的压缩。不过,因为该压缩机制非常简单,因此使用RLE算法的程序也相对更容易编写。笔者曾用自己做成的RLE算法压缩程序对各种类型的文件进行过压缩,其结 阅读全文
posted @ 2023-02-12 16:24 原魏薯片 阅读(27) 评论(0) 推荐(0) 编辑
摘要:由于半角字母中,1个字符是作为1个字节的数据被保存在文件中的,因此上述文件的大小就是17个字节。我们可以使用方式来压缩。 把文件内容用“数据x重复次数”的形式来表示的压缩方法称为RLE(Run Length Encoding,行程长度编码)算法(图6-2)。RLE算法是一种很好的压缩方法,经常被用于 阅读全文
posted @ 2023-02-12 16:02 原魏薯片 阅读(32) 评论(0) 推荐(0) 编辑
摘要:文件是将数据存储在磁盘等存储媒介中的一种形式。程序文件中存储数据的单位是字节。 文件就是字节数据的集合。用1字节(=8位)表示字节数据有256种,用二进制数来表示的话,其范围就是00000000~11111111。如果文件中存储的数据是文字,那么该文件就是文本文件。如果是图形那么该文件就是图像文件。 阅读全文
posted @ 2023-02-12 15:53 原魏薯片 阅读(130) 评论(0) 推荐(0) 编辑

点击右上角即可分享
微信分享提示