熵、相对熵与互信息

一、熵

熵的定义

其对数log的底为2,若使用底为b的对数,则记为。当对数底为时,熵的单位为奈特。

表示数学期望,如果,则随机变量的期望值为,

关于的分布自指数学期望。而熵为随机变量的期望值,其的概率密度函数,则可写为,

引理

证明

 

二、联合熵与条件熵:

对于服从联合分布为的一对离散随机变量

联合熵的定义

条件熵的定义

定理链式法则

证明

等价记为

推论

,但

 

三、相对熵与互信息

两个概率密度函数为之间的相对熵或Kullback-Leibler距离定义为,

定义 考虑两个随机变量,它们的联合概率密度函数为,其边际概率密度函数分别是

互信息为联合分布和乘积分布之间的相对熵,

 

四、熵和互信息的关系

还可以将互信息写为,

由此可以看出,互信息是在给定知识条件下的不确定度的缩减量。则,

,联系到前面的,可得,

最后得出,

因此,随机变量与自身的互信息为该随机变量的熵。有时,熵称为自信息就是这个原因。

熵和互信息的关系如下,

 

五、熵、相对熵与互信息的链式法则

一组随机变量的熵等于条件熵之和。

定理 设随机变量服从,则

证明一

证明二,由

可得:

给定时由于的知识而引起关于的不确定度的缩减量,即条件互信息的定义

定理 互信息的链式法则

证明

条件相对熵的定义

定理 相对熵的链式法则

证明

 

posted @ 2016-08-31 17:47  clairvoyant  阅读(5224)  评论(1编辑  收藏  举报