PRML-公式推导 1.88
https://biggerhao.github.io/blog/2018/02/PRML-1-88/
原文回顾
在回归问题中,我们需要选择一个估计函数 ,来对每个输入 预测其对应的值 。这样做就会导致损失 。平均损失或期望损失的公式为
回归问题中常用的一种损失函数是平方损失,即 。那么期望损失就可以写成
我们的目标就是选择一个 使得 最小。如果我们假设 是完全灵活的(completely flexible),那么可以通过变分法得到
以上是 PRML 中第 46 页关于回归的一点介绍,其中公式 (1.88) 比较费解,下面对该公式的推导进行分析。
公式推导
上述结果用到了欧拉方程,首先我们来看一下什么是欧拉方程。
定理 使最简泛函
取极值且满足固定边界条件 的极值曲线 应满足必要条件 的解,式中, 是 的已知函数并有二阶连续偏导数。
式 (D.8) 称为泛函 (D.5) 的欧拉方程。
回到式 (1.87),这个泛函还不具备 (D.5) 的形式,根据富比尼定理,交换积分顺序得 这时取 ,根据欧拉方程可得使得 (1.87) 取最小值的必要条件为 由于 与 无关,所以 ,又根据莱布尼兹公式,有 (注:书中 的写法不知道对不对。)
参考资料
- Pattern Recognition and Machine Learning. Bishop.
- 变分法基础. 老大中.
- Bishop ML and pattern recognition calculus of variations linear regression loss function
- Fubini's theorem
- Leibniz integral rule
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· DeepSeek 开源周回顾「GitHub 热点速览」
· 物流快递公司核心技术能力-地址解析分单基础技术分享
· .NET 10首个预览版发布:重大改进与新特性概览!
· AI与.NET技术实操系列(二):开始使用ML.NET
· .NET10 - 预览版1新功能体验(一)