霍夫曼 Huffman 编码简单了解
霍夫曼编码(也叫哈夫曼编码)
即时码:必须是唯一可译码,对一组即时码来说,其中的任意一个码字都只能与一种信号存在对应关系,而且任意一个码字都不能是其他码字的前缀。
即时码的产生常采用树形结构:
![]()
是用上边的即时码,
假设收到这样一组信号:
100101001
则可以唯一解析出以下 4 个码字:
1
001
01
001
编码过程
- 设有一个图像序列,含有 8 个灰度级,$x1, x2, x3,,, x8$,概率分别为:
p1 | p2 | p3 | p4 | p5 | p6 | p7 | p8 |
---|---|---|---|---|---|---|---|
0.4 | 0.18 | 0.1 | 0.1 | 0.07 | 0.06 | 0.05 | 0.04 |
- 选取最小两个概率进行合并,形成一个新的概率集合,重新进行排序。重复此步骤直到最终只剩两个概率为止,得到霍夫曼树

- 根据霍夫曼树分配码字,得到霍夫曼编码

概率越大,码长越短;概率越小,码长越短
计算平均码长:每一个霍夫曼码长与它的概率乘积之和

这里的平均码长为 2.61,小于自然码长为 3(表示 8 个数至少需要 3 位),说明进行了压缩
计算熵、编码效率
计算绝对冗余、相对冗余
总结
霍夫曼编码是无失真编码中效率较高的一种编码方法。
在分配码字过程中,随机赋 “0” 和 “1” 的不同,结果会使码字不同(不唯一),而码字长和平均码字长不会改变,他也是唯一可解码的。
但其缺点是信源缩减过程复杂,运算量大。
解决办法:(适应性 Huffman 编码 ⭐⭐)https://blog.csdn.net/qq_28829853/article/details/104111533
- 使用多叉树压缩编码长度,提高码元携带的信息
- 使用更少的字符来构建编码表,调高字符的频次
- 减少文件头部携带的信息,提高编码率
对于 1.
:
改进后的霍夫曼编码,不再是二进制的。它可以是多进制,例如26进制。操作方法:
把符号按出现概率排序,合并概率最小的 26 项,为新的节点。然后重复这一过程,剩下的步骤与经典霍夫曼编码相同。
应用:把汉语单字读音的416音按26进制进行霍夫曼编码,结果,像de,shi,yu这些概率高的读音分配了较短的编码;dia,den这些不常用的读音分配较长的编码。26进制对应键盘的26键,这样就诞生了一种新的输入法
原文链接:https://blog.csdn.net/proorck2019/article/details/109445764
参考:
- 西安电子科技大学《现代图像分析 图像压缩便编码》https://haokan.baidu.com/v?pd=wisenatural&vid=16617709331236028375
沉舟侧畔千帆过,病树前头万木春。
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· AI与.NET技术实操系列:基于图像分类模型对图像进行分类
· go语言实现终端里的倒计时
· 如何编写易于单元测试的代码
· 10年+ .NET Coder 心语,封装的思维:从隐藏、稳定开始理解其本质意义
· .NET Core 中如何实现缓存的预热?
· 分享一个免费、快速、无限量使用的满血 DeepSeek R1 模型,支持深度思考和联网搜索!
· 基于 Docker 搭建 FRP 内网穿透开源项目(很简单哒)
· ollama系列01:轻松3步本地部署deepseek,普通电脑可用
· 25岁的心里话
· 按钮权限的设计及实现