lotus

贵有恒何必三更眠五更起最无益只怕一日曝十日寒

:: :: :: ::

::

1846 随笔 :: 0 文章 :: 109 评论 :: 288万阅读

公告

昵称：白露~
园龄： 10年6个月
粉丝： 289
关注： 135

随笔分类

随笔档案

阅读排行榜

评论排行榜

推荐排行榜

最新评论

1. Re:服务的有状态和无状态
优秀
--bky_fxs
2. Re:动态规划-七种背包问题
厉害
--自倚修行
3. Re:redis中查找大key方法汇总
在使用这个python 检查脚本的时候 python2执行失败提示没有redis 使用Python3 的话提示只显示这个，没显示key,请问是跟python版本有关吗？我python3的版本为...
--小百百-
4. Re:讲讲什么是 JMM
讲的很细，也算是比较完整，要是加上as-if-serial，这样jmm俩大原则就完整了
--钟小嘿
5. Re:MySQL里判断某个字符串是否包含某个字符串的3种方法
没有字符串检索吗？
--望天hous

信息熵通俗易懂的例子

转自知乎 https://www.zhihu.com/question/22178202/answer/223017546

本科学的时候是院长教的，当时他说这个东西很有用，也仔细听了没懂什么意思，现在回过头来看，还真有用。

信息熵的定义与上述这个热力学的熵，虽然不是一个东西，但是有一定的联系。熵在信息论中代表随机变量不确定度的度量。一个离散型随机变量 $X$ 的熵 $H(X)$ 定义为：

$H(X)=-\sum\limits_{x\in\mathcal{X}}p(x)\log p(x)$

这个定义的特点是，有明确定义的科学名词且与内容无关，而且不随信息的具体表达式的变化而变化。是独立于形式，反映了信息表达式中统计方面的性质。是统计学上的抽象概念。

所以这个定义如题主提到的可能有点抽象和晦涩，不易理解。那么下面让我们从直觉出发，以生活中的一些例子来阐述信息熵是什么，以及有什么用处。

直觉上，信息量等于传输该信息所用的代价，这个也是通信中考虑最多的问题。比如说：赌马比赛里，有4匹马 $\{A,B,C,D\}$ ，获胜概率分别为 $\{\frac{1}{2},\frac{1}{4},\frac{1}{8},\frac{1}{8}\}$ 。

接下来，让我们将哪一匹马获胜视为一个随机变量 $X\in\{A,B,C,D\}$ 。假定我们需要用尽可能少的二元问题来确定随机变量 $X$ 的取值。

例如：问题1：A获胜了吗？问题2：B获胜了吗？问题3：C获胜了吗？最后我们可以通过最多3个二元问题，来确定 $X$ 的取值，即哪一匹马赢了比赛。

如果 $X=A$ ，那么需要问1次（问题1：是不是A？），概率为 $\frac{1}{2}$ ；

如果 $X=B$ ，那么需要问2次（问题1：是不是A？问题2：是不是B？），概率为 $\frac{1}{4}$ ；

如果 $X=C$ ，那么需要问3次（问题1，问题2，问题3），概率为 $\frac{1}{8}$ ;

如果 $X=D$ ，那么同样需要问3次（问题1，问题2，问题3），概率为 $\frac{1}{8}$ ；

那么很容易计算，在这种问法下，为确定 $X$ 取值的二元问题数量为：

$E(N)=\frac{1}{2}\cdot1+\frac{1}{4}\cdot2+\frac{1}{8}\cdot3+\frac{1}{8}\cdot3=\frac{7}{4}$

那么我们回到信息熵的定义，会发现通过之前的信息熵公式，神奇地得到了：

$H(X)=\frac{1}{2}\log(2)+\frac{1}{4}\log(4)+\frac{1}{8}\log(8)+\frac{1}{8}\log(8)=\frac{1}{2}+\frac{1}{2}+\frac{3}{8}+\frac{3}{8}=\frac{7}{4}\mathrm{bits}$

在二进制计算机中，一个比特为0或1，其实就代表了一个二元问题的回答。也就是说，在计算机中，我们给哪一匹马夺冠这个事件进行编码，所需要的平均码长为1.75个比特。

平均码长的定义为： $L(C)=\sum\limits_{x\in\mathcal{X}}p(x)l(x)$

很显然，为了尽可能减少码长，我们要给发生概率 $p(x)$ 较大的事件，分配较短的码长 $l(x)$ 。这个问题深入讨论，可以得出霍夫曼编码的概念。

那么 $\{A,B,C,D\}$ 四个实践，可以分别由 $\{0,10,110,111\}$ 表示，那么很显然，我们要把最短的码 $0$ 分配给发生概率最高的事件 $A$ ，以此类推。而且得到的平均码长为1.75比特。如果我们硬要反其道而行之，给事件 $A$ 分配最长的码 $111$ ，那么平均码长就会变成2.625比特。

posted on 2019-09-10 15:02 白露~ 阅读(2024) 评论(0) 编辑收藏举报

刷新页面返回顶部

登录后才能查看或发表评论，立即登录或者逛逛博客园首页

【推荐】还在用 ECharts 开发大屏？试试这款永久免费的开源 BI 工具！
【推荐】国内首个AI IDE，深度理解中文开发场景，立即下载体验Trae
【推荐】编程新体验，更懂你的AI，立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包，你的智能百科全书，全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell：AI 加持，快人一步

编辑推荐：
· 探究高空视频全景AR技术的实现原理
· 理解Rust引用及其生命周期标识（上）
· 浏览器原生「磁吸」效果！Anchor Positioning 锚点定位神器解析
· 没有源码，如何修改代码逻辑？
· 一个奇形怪状的面试题：Bean中的CHM要不要加volatile？

阅读排行：
· 分享4款.NET开源、免费、实用的商城系统
· 全程不用写代码，我用AI程序员写了一个飞机大战
· MongoDB 8.0这个新功能碉堡了，比商业数据库还牛
· 白话解读 Dapr 1.15：你的「微服务管家」又秀新绝活了
· 上周热点回顾（2.24-3.2）

历史上的今天：
2018-09-10 分库分表后如何部署上线