交叉熵、KL 散度 | 定义与相互关系


1 KL 散度

对于离散概率分布 PQ ,KL 散度定义为:

KL(PQ)=ExPlogP(x)logQ(x)=xP(x)logP(x)Q(x)

对于连续概率分布,定义为:

KL(PQ)=p(x)logp(x)q(x)dx

其中,p(x)P 的概率密度函数,q(x)Q 的概率密度函数。

KL 散度的性质:

  1. 非负性:KL 散度总是非负的,KL(PQ)0
  2. 不对称性:KL 散度不是对称的,即 KL(PQ)KL(QP)
  3. 零点:当 PQ 完全相同时,KL(PQ)=0
  4. 不满足三角不等式:KL 散度不满足传统意义上的三角不等式。

2 交叉熵

交叉熵(cross-entropy)和 KL 散度联系密切,也可以用来衡量两个分布的差异。

对于离散概率分布 PQ ,交叉熵定义为:

H(P,Q)=ExPlogQ(x)=P(xi)logQ(xi)

对于连续概率分布,定义为:

H(P,Q)=p(x)logq(x)dx

可以看出,H(P,Q)=H(P)+DKL(PQ) ,其中 H(P) 是 P 的熵。

交叉熵的性质:

  1. 非负性
  2. 不对称性:和 KL 散度相同,交叉熵也不具备对称性,即 H(P,Q)H(Q,P)
  3. 对同一个分布求交叉熵,等于对其求熵。


本文作者:MoonOut

本文链接:https://www.cnblogs.com/moonout/p/18322747

版权声明:本作品采用知识共享署名-非商业性使用-禁止演绎 2.5 中国大陆许可协议进行许可。

posted @   MoonOut  阅读(190)  评论(0编辑  收藏  举报
点击右上角即可分享
微信分享提示
评论
收藏
关注
推荐
深色
回顶
收起
  1. 1 Sibelius: Violin Concerto in D Minor, Op. 47:III. Allegro, ma non tanto Jascha Heifetz / Chicago Symphony Orchestra
Sibelius: Violin Concerto in D Minor, Op. 47:III. Allegro, ma non tanto - Jascha Heifetz / Chicago Symphony Orchestra
00:00 / 00:00
An audio error has occurred.