哈夫曼编码（理解）

哈夫曼编码(Huffman Coding)，又称霍夫曼编码，是一种编码方式，可变字长编码(VLC)的一种。Huffman于1952年提出一种编码方法，该方法完全依据字符出现概率来构造异字头的平均长度最短的码字，有时称之为最佳编码，一般就叫做Huffman编码（有时也称为霍夫曼编码）。

哈夫曼编码，主要目的是根据使用频率来最大化节省字符（编码）的存储空间。

简易的理解就是，假如我有A,B,C,D,E五个字符，出现的频率（即权值）分别为5,4,3,2,1,那么我们第一步先取两个最小权值作为左右子树构造一个新树，即取1，2构成新树，其结点为1+2=3，如图：

虚线为新生成的结点，第二步再把新生成的权值为3的结点放到剩下的集合中，所以集合变成{5,4,3,3}，再根据第二步，取最小的两个权值构成新树，如图：

再依次建立哈夫曼树，如下图：

其中各个权值替换对应的字符即为下图：

所以各字符对应的编码为：A->11,B->10,C->00,D->011,E->010
霍夫曼编码是一种无前缀编码。解码时不会混淆。其主要应用在数据压缩，加密解密等场合。

如果考虑到进一步节省存储空间，就应该将出现概率大（占比多）的字符用尽量少的0-1进行编码，也就是更靠近根（节点少），这也就是最优二叉树-哈夫曼树。
为什么？-----> 权值大的在上层，权值小的在下层。满足出现频率高的码长短。

哈夫曼编码的带权路径权值：叶子节点的值 * 叶子节点的高度（根节点为0）

上图的带权路径长度为：（3+4+5）*2+（1+2）*3=33

以上转载自https://blog.csdn.net/qq_36653505/article/details/81701181

posted @ 2019-08-04 10:56 知道了呀~ 阅读(84675) 评论(0) 编辑收藏举报

刷新页面返回顶部

登录后才能查看或发表评论，立即登录或者逛逛博客园首页

阅读排行：
· 10年+ .NET Coder 心语 ── 封装的思维：从隐藏、稳定开始理解其本质意义
· 地球OL攻略 —— 某应届生求职总结
· 提示词工程——AI应用必不可少的技术
· Open-Sora 2.0 重磅开源！
· 周边上新：园子的第一款马克杯温暖上架

公告

昵称：知道了呀~
园龄： 6年6个月
粉丝： 84
关注： 22

+加关注

2025年3月

日

一

二

三

四

五

六

知道了呀~

~ o(￣▽￣)o~

哈夫曼编码（理解）

公告

搜索

常用链接

最新随笔

积分与排名

随笔分类

随笔档案

递归

阅读排行榜

评论排行榜

推荐排行榜

知道了呀~

~ o(*￣▽￣*)o~

哈夫曼编码（理解）

公告

搜索

常用链接

最新随笔

积分与排名

随笔分类

随笔档案

递归

阅读排行榜

评论排行榜

推荐排行榜

~ o(￣▽￣)o~