2022-12-05 K-L散度

2022-12-05 K-L散度

description

Kullback-Leibler(KL)散度介绍 - 知乎 (zhihu.com)

简介

一种比较两个概率分布的方法, 称为Kullback-Leibler散度(通常简称为KL散度)
通常用简单的分布来近似一个复杂的分布,表示在选择近似时候损失了多少信息

KL散度起源于信息论
信息熵是信息论中一个重要的概念,H=i=1Np(xi)logp(xi)
当使用log2计算时,熵解释为“编码信息所需要的最小比特数”

K-L散度

K-L散度就是在信息熵的基础上修改,表示丢失了多少信息

DKL(p||q)=i=1Np(xi)(logp(xi)logq(xi))

看起来和期望一样

改写得到:DKL(q||p)=E[logp(xi)logq(xi)]
比较常见的形式:

DKL(q||p)=i=1Np(xi)logp(xi)q(xi)

或者DKL(q||p)=Ex p[logp(xi)q(xi)]

注意

[!attention]
K-L衡量的不是分布的距离
因为K-L是非对称的

使用K-L散度作为优化目标

可以将KL散度作为目标函数来找到我们可以得出的任何近似分布的最优值

如VAE, 贝叶斯

posted @   cyinen  阅读(14)  评论(0编辑  收藏  举报
点击右上角即可分享
微信分享提示