深度学习 – 微积分、信息论 - 基本概念

微积分

导数：当函数y=f(x)的自变量x在一点x0上产生一个增量Δx时，函数输出值的增量Δy与自变量增量Δx的比值在Δx趋于0时的极限a如果存在，a即为在x0处的导数，记作f'(x0)或df(x0)/dx。其图像表示为如下：

类似的概念还有：二维空间中的“切线”。

信息论

熵：也称信息熵，熵越大，不确定性越大。更多关于熵的解释请参看另一篇博客《机器学习 - 相关概念与实现流程》
KL 散度：也称为相对熵，它衡量了两个分布之间的差异。若结合如下事实：
- 真实事件的信息熵就是 p(xi) log p(xi)；
- 理论拟合的事件的信息量就是 log q(xi)；
- 真实事件的概率就是 p(xi)。

在模型优化、数据分析和统计等场合，就可以使用 KL 散度衡量选择的近似分布与数据原分布有多大差异 -- 当拟合事件和真实事件一致的时候 KL 散度就成了 0，不一样的时候就大于 0。

posted @ 2021-01-30 21:02 划水De雁小明阅读(241) 评论(0) 编辑收藏举报

刷新页面返回顶部