赫夫曼树

前置知识

路径长度和带权路径长度

路径长度：两节点间路径的分支数量为路径长度。如二叉树a从根节点到D节点的路径长度为4，根节点到B节点的路径长度为2。

树的路径长度：从根节点到每一个结点的路径长度之和。如二叉树a的路径长度为：1+1+2+2+3+3+4+4=20。

带权路径长度：从该节点到树根节点的路径长度乘上节点的权值。

树的带权路径长度（WPL）：树中每个叶子结点的带权路径长度之和。如二叉树a中的WPL=5×1+15×2+40×3+30×4+10×4=315。b中的WPL=5×3+15×3+40×2+30×2+10×2=220。（图中省略了%号）

带权路径长度最小的二叉树称为赫夫曼树。

假设节点的权值为一个文件中某个字符出现的概率，同时这个文件拥有1000个字符，则使用a树想要找到某个字符需要3150次查询，而b树只需要2200次。

构造赫夫曼树

1．先把有权值的叶子结点按照从小到大的顺序排列成一个有序序列AEBDC。

2．取两个最小权值的结点作为一个新节点N1的两个子结点，注意相对较小的是左孩子，这里就是A 为N的左孩子，E为N1的右孩子，N1的权值变为两个孩子节点权值之和重新加入到序列中，

同时保持有序。

3.重复第一步操作直到只剩一个节点为止，这最后一个节点便是赫夫曼树的根节点。

结果

赫夫曼编码

赫夫曼树不仅仅可以用来减少判断的次数还可以用来编码，减少编码的长度从而实现对文件压缩的效果。

例如正常情况下我们可以对字符这样编码

现在要对含有这六个字符的字符串进行压缩。

假设六个字母的频率为A 27,B 8,C 15,D 15,E 30,F 5，合起来正好是100%。那就意味着,我们完全可以重新按照赫夫曼树来规划它们。

之后依照遍历时是向左走还是向右走对字符重新编码可得

可以看到一些字符变短了，这样也就实现了压缩效果。需要注意的是，任意一个字符的编码不是另一个字符编码的前缀，例如一个字符的编码为1001，如果另一个字符的编码是100，在遍历

一个字符串10011001时，无法获知刚开头是字符1001的编码还是100的编码，从而造成错乱。

posted @ 2023-01-07 12:39 redintonc 阅读(88) 评论(0) 编辑收藏举报

刷新页面返回顶部

登录后才能查看或发表评论，立即登录或者逛逛博客园首页

相关博文：

· 408笔记--树基础

· 最小生成树

· 哈夫曼树和哈夫曼编码

· 哈夫曼树与哈夫曼编码

· 数据结构之树（Huffman tree(赫夫曼树 / 霍夫曼树 / 哈夫曼树 / 最优二叉树)）

公告

昵称： redintonc
园龄： 4年1个月
粉丝： 1
关注： 0

+加关注

2025年3月

日

一

二

三

四

五

六

随笔分类

随笔档案

阅读排行榜

评论排行榜

1. 有关SPFA，Dijkstra和l链式前向星(2)

redintonc

赫夫曼树

公告

搜索

常用链接

我的标签

随笔分类

随笔档案

阅读排行榜

评论排行榜

推荐排行榜

最新评论