过拟合与欠拟合

过拟合与欠拟合

loss函数：对模型好坏的评估，损失loss越大，模型越坏
bias与variance

bias：模型预测的结果偏差较大。即 $|\overline{f}-\hat{f}|$ 较大， $\overline{f}$ 是所有样本的预测均值， $\hat{f}$ 是真实值
variance：模型预测的结果比较分散（误差较大）。即 $\sum\limits_{*}(\overline{f}-f^*)^2$ 较大， $f^*$ 是某个样本的预测值

两种不好的拟合效果
欠拟合：loss很大，模型的预测能力不佳，很可能bias大variance小
- 可能原因：参数过少、样本量不够
- 解决方式：增加参数、增加样本量（参数不够的情况下增加样本量没用）
过拟合：train得到的loss小，但test得到的loss大，很可能bias小variance大
- 可能原因：参数过多、样本量不够
- 解决方式：减少参数、增加样本量、添加正则化项

正则化

添加正则化：loss函数加上 $\lambda\sum \limits_{i} (\omega^i)^2$ ，其中 $\omega^i$ 是模型的权重参数
原理：可以理解为让拟合曲线更加平滑，减少输入量带来的影响，即减小variance。
$\lambda$ 越大，降低loss时就必须更加考虑降低 $\omega^i$ ，从而使得曲线更平滑

训练集、验证集、测试集

添加验证集的原因：采集样本和真实世界的全总样本总有差距，需要验证集尽可能的平衡这些差距
比如在下图，如果没有验证集，train上得到的模型在public test上的结果小，但很可能在private test上的结果大，这也是为什么训练出来的模型在真实世界中的loss一般会更大一些

使用交叉验证法：

posted @ 2023-06-19 21:58 kksk43 阅读(54) 评论(0) 编辑收藏举报

刷新页面返回顶部

登录后才能查看或发表评论，立即登录或者逛逛博客园首页

【推荐】还在用 ECharts 开发大屏？试试这款永久免费的开源 BI 工具！
【推荐】国内首个AI IDE，深度理解中文开发场景，立即下载体验Trae
【推荐】编程新体验，更懂你的AI，立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包，你的智能百科全书，全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell：AI 加持，快人一步

相关博文：

· 第12章代数系统

· 第11章特殊图

· 欠拟合与过拟合

· 模型选择、过拟合和欠拟合

· 过拟合与欠拟合

阅读排行：
· 全程不用写代码，我用AI程序员写了一个飞机大战
· DeepSeek 开源周回顾「GitHub 热点速览」
· 记一次.NET内存居高不下排查解决与启示
· MongoDB 8.0这个新功能碉堡了，比商业数据库还牛
· 白话解读 Dapr 1.15：你的「微服务管家」又秀新绝活了

特效

黑夜

侧边栏隐藏