浅谈哈夫曼编码

做NOIP初赛遇到了,还是填个坑吧


首先,哈夫曼编码是哈夫曼树的应用,不知道什么是哈夫曼树的可以搜一下

具体操作:

(1)我们有一个集合,集合里有一些数,升序排列

(2)每次选出两个最小的数,然后合并,删除,把新生成的数放到集合里

(3)重复步骤2,直到用完所有的数,树也就建好了,然后把左儿子和右儿子定为1和0,两个相反,但只要确定,整棵树都要用同一种编码方式

(4)每个元素的哈夫曼编码就是其路径上的数


这样说可能不太明白,我们还是举个例子

现有一段文言文,要通过二进制哈夫曼编码进行压缩。简单起见,假设这段文言文只由
4 个汉字“之”、“乎”、“者”、“也”组成,它们出现的次数分别为 700、600、300、
400。那么,“也”字的编码长度可能是( )。
A. 1 B. 2 C. 3 D. 4

这是NOIP2011提高组初赛的多选

正确答案是BC

我们只举一个来说,另一个就显而易见了

首先集合里有四个数{300,400,600,700}

先取两个300,400

合并,300+400=700

如图

 

然后放入集合,此时{600,700,700}

取600和我们刚才合并出来的700

然后是700和700

树就建好了

然后是标号:

一一对应,我们得到“也”:111        长度为3

保险起见,我把另一个图画一下:(其实就是把合并的顺序改变一下)

此时  “也”:01    长度为2

这同时也说明了,在集合中有重复的数时,哈夫曼编码不止一种。

希望对大家有帮助

posted @ 2018-10-09 23:19  Bruce--Wang  阅读(906)  评论(1编辑  收藏  举报