1.学习准则
一个好的模型应该在所有取值上都与真实映射函数一致
2.损失函数 Loss Function
损失函数是一个非负实数函数,用来量化模型预测和真实标签之间的差异
以回归问题为例
平方损失函数 Quadratic Loss Function
L(y,f(x;θ))=12(y−f(x;θ))2
3.期望风险 Expected Risk
R(θ)=E(x,y)∼pr(x,y)[L(y,f(x;θ))]
理想的学习准则应该是损失函数在真实的分布(pr(x,y))下的期望最小化
但是实际这个期望风险无法计算,因为不知道pr(x,y)
根据大数定律,Epr[f(x)],通过采集pr分布下的样本x(1),...,x(N),E≈1N[f(x(1))+...+f(x(N))]
样本就是训练集
期望风险可以近似为
训练数据:x(n),y(n)Nn=1
经验风险(Empirical Risk)
RempD(θ)=1N∑Nn=1L(y(n),f(x(n);θ))
当N→∞,经验风险趋近于期望风险
经验风险最小化 Empirical Risk Minimization,ERM
寻找一个参数θ∗,使得经验风险函数最小化
θ∗=argminθRempD(θ)
当风险函数确定,机器学习问题转为一个最优化问题
4.凸,非凸问题
5.泛化误差
期望风险
R(θ)=E(x,y)∼pr(x,y)[L(y,f(x;θ))]
经验风险(Empirical Risk)
RempD(θ)=1N∑Nn=1L(y(n),f(x(n);θ))
泛化误差
GD(θ)=R(θ)−RempD(θ)
6.正则化
降低模型复杂度
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· DeepSeek 开源周回顾「GitHub 热点速览」
· 物流快递公司核心技术能力-地址解析分单基础技术分享
· .NET 10首个预览版发布:重大改进与新特性概览!
· AI与.NET技术实操系列(二):开始使用ML.NET
· .NET10 - 预览版1新功能体验(一)