KL散度计算
KL散度(Kullback-Leibler Divergence)是用来度量两个概率分布相似度的指标,是经典损失函数,应用于PPO等算法参数估计设计。
KL散度的定义
假设对随机变量
如果如果
KL散度的性质(以离散形式为例)
- 非负性
- 仿射变换不变性
假设 ,那么: - 非对称性
- 值域
在一定条件下可以趋向于无穷。
KL散度的应用和常见分布KL散度的计算
详见[link](关于KL散度(Kullback-Leibler Divergence)的笔记 - 捡到一束光的文章 - 知乎
https://zhuanlan.zhihu.com/p/438129018)
参考文章:关于KL散度(Kullback-Leibler Divergence)的笔记 - 捡到一束光的文章 - 知乎
https://zhuanlan.zhihu.com/p/438129018
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· 震惊!C++程序真的从main开始吗?99%的程序员都答错了
· winform 绘制太阳,地球,月球 运作规律
· 【硬核科普】Trae如何「偷看」你的代码?零基础破解AI编程运行原理
· 上周热点回顾(3.3-3.9)
· 超详细:普通电脑也行Windows部署deepseek R1训练数据并当服务器共享给他人