2020 年 11月 18 日随笔档案 - Parallax

2020年11月18日

摘要：训练技巧 1.首先用小批量数据，查看是否代码有问题，理论上模型应该能将损失降到0左右，准确率为1. 2.使用较小的学习率比如1e-6,观察损失值的变化，如果损失不怎么动就是学习率太小了，增大学习率。一般对于损失的计算来说：像位置坐标这种是连续值变化的东西，倾向于回归损失如L1 或L2损失其他的比阅读全文

posted @ 2020-11-18 04:31 Parallax 阅读(1047) 评论(0) 推荐(0) 编辑

Parallax

初极狭，才通人；复行数十步，豁然开朗。

公告