文件压缩的原理 - 我就是那个不信邪的

文件压缩的原理

目前压缩技术可分为通用无损数据压缩与有损压缩两大类，但不管是采用何种技术模型，其本质内容都是一样的，即都是通过某种特殊的编码方式将数据信息中存在的重复度、冗余度有效地降低，从而达到数据压缩的目的。比如：“中国”是“中华人民共和国”的简称，但前者的字数是2，后者则是7，但我们都不会对它们俩所要表达的意思产生误解，这是因为前者保留了信息中最“关键点”。同时，作为有思维能力的人类，我们可以根据前后词汇关系和知识积累，就可推断出其原来的全部信息。压缩技术也一样，在不影响文件的基本使用的前提下，只保留原数据中一些“关键点”，去掉了数据中的重复的、冗余的信息，从而达到压缩的目的。这就是文件压缩技术所要遵循的最基本原理。

例如：一个文件的内容是11100000000...000001111(中间有一万个零)，你要完全写出来的话，会很长很长，但如果你写“111一万个零1111”来描述它，也能得到同样的信息，但却只有十一个字，这样就减小了文件体积。在具体应用中很少有这样的文件存在,那些文件都相当复杂,根据一定的数学算法,权衡把哪段字节用一个特定的更小字节代替，就可以实现数据最大程度的无损压缩.

posted on 2015-11-02 19:31 我就是那个不信邪的阅读(1076) 评论(0) 收藏举报