训练集、测试集loss容易出现的问题总结

1、

train loss 不断下降,test loss不断下降:说明网络仍在学习;

train loss 不断下降,test loss趋于不变:说明网络过拟合;

train loss 趋于不变,test loss不断下降:说明数据集100%有问题;

train loss 趋于不变,test loss趋于不变:说明学习遇到瓶颈,需要减小学习率或批量数目;或者是数据集有问题(数据集标注错误数据比较多)

train loss 不断上升,test loss不断上升:说明网络结构设计不当,训练超参数设置不当,数据集经过清洗等问题。

2、训练时损失出现nan的问题,可能导致梯度出现nan的三个原因:

  梯度爆炸。也就是说梯度数值超出范围变成nan. 通常可以调小学习率、加BN层或者做梯度裁剪来试试看有没有解决。

  损失函数或者网络设计。比方说,出现了除0,或者出现一些边界情况导致函数不可导,比方说log(0)、sqrt(0).

  脏数据。可以事先对输入数据进行判断看看是否存在nan.

posted @   U_C  阅读(12903)  评论(1编辑  收藏  举报
编辑推荐:
· 从 HTTP 原因短语缺失研究 HTTP/2 和 HTTP/3 的设计差异
· AI与.NET技术实操系列:向量存储与相似性搜索在 .NET 中的实现
· 基于Microsoft.Extensions.AI核心库实现RAG应用
· Linux系列:如何用heaptrack跟踪.NET程序的非托管内存泄露
· 开发者必知的日志记录最佳实践
阅读排行:
· TypeScript + Deepseek 打造卜卦网站:技术与玄学的结合
· Manus的开源复刻OpenManus初探
· 写一个简单的SQL生成工具
· AI 智能体引爆开源社区「GitHub 热点速览」
· C#/.NET/.NET Core技术前沿周刊 | 第 29 期(2025年3.1-3.9)
历史上的今天:
2018-05-14 TX2上yolov3精度和速度优化方向
2018-05-14 yolo原理学习
2018-05-14 ubuntu常用命令
2018-05-14 darknet源码学习
2018-05-14 关于模型优化的思考
2018-05-14 Batch Normalization层
2018-05-14 深度学习网络结构中超参数momentum了解
点击右上角即可分享
微信分享提示