1.相对熵,KL散度
真实分布p(x),近似分布q(x)对其建模,则分布p(x),q(x)之间的相对熵/KL散度为

注意KL(p||q)≠KL(q||p),相对熵不是一个对称量
KL散度可以看做是两个分布p(x)和q(x)之间不相似程度的度量
2.KL散度的近似公式
对于p(x),可以用q(x|θ)来近似这个分布,然后用p(x)与q(x|θ)之间的KL散度来最小化,求出θ参数,但是这个行不通,因为真实分布p(x)未知
但是我们有已经观察到了服从p(x)分布的有限数量的训练点xn,n=1,..,N,那关于p(x)的期望就可以通过这些点的有限加和,用公式(1.35)来近似,即


【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· DeepSeek 开源周回顾「GitHub 热点速览」
· 物流快递公司核心技术能力-地址解析分单基础技术分享
· .NET 10首个预览版发布:重大改进与新特性概览!
· AI与.NET技术实操系列(二):开始使用ML.NET
· .NET10 - 预览版1新功能体验(一)