过拟合与欠拟合
过拟合与欠拟合
loss函数:对模型好坏的评估,损失loss越大,模型越坏
bias与variance
- bias:模型预测的结果偏差较大。即较大,是所有样本的预测均值,是真实值
- variance:模型预测的结果比较分散(误差较大)。即较大,是某个样本的预测值
两种不好的拟合效果 - 欠拟合:loss很大,模型的预测能力不佳,很可能bias大variance小
- 可能原因:参数过少、样本量不够
- 解决方式:增加参数、增加样本量(参数不够的情况下增加样本量没用)
- 过拟合:train得到的loss小,但test得到的loss大,很可能bias小variance大
- 可能原因:参数过多、样本量不够
- 解决方式:减少参数、增加样本量、添加正则化项
正则化
- 添加正则化:loss函数加上,其中是模型的权重参数
- 原理:可以理解为让拟合曲线更加平滑,减少输入量带来的影响,即减小variance。
越大,降低loss时就必须更加考虑降低,从而使得曲线更平滑
训练集、验证集、测试集
添加验证集的原因:采集样本和真实世界的全总样本总有差距,需要验证集尽可能的平衡这些差距
比如在下图,如果没有验证集,train上得到的模型在public test上的结果小,但很可能在private test上的结果大,这也是为什么训练出来的模型在真实世界中的loss一般会更大一些
使用交叉验证法:
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· 全程不用写代码,我用AI程序员写了一个飞机大战
· DeepSeek 开源周回顾「GitHub 热点速览」
· 记一次.NET内存居高不下排查解决与启示
· MongoDB 8.0这个新功能碉堡了,比商业数据库还牛
· 白话解读 Dapr 1.15:你的「微服务管家」又秀新绝活了