摘要: 训练技巧 1.首先用小批量数据,查看是否代码有问题,理论上模型应该能将损失降到0左右,准确率为1. 2.使用较小的学习率比如1e-6,观察损失值的变化,如果损失不怎么动就是学习率太小了,增大学习率。 一般对于损失的计算来说:像位置坐标这种是连续值变化的东西,倾向于回归损失如L1 或L2损失 其他的比 阅读全文
posted @ 2020-11-18 04:31 Parallax 阅读(1000) 评论(0) 推荐(0) 编辑