2018年5月6日

摘要: 恢复内容开始 今天在训练时遇到的问题 把损失函数由 MSE 改成 L1 Loss 的时候 Loss 有了明显的下降 以前一直觉得 MSE 相对来说会更好 ,因为求导的话有标签与结果的差值作为系数,相差越大梯度越大。 L1 Loss 梯度都是一样的。 查了一下,看到了另一种说法: 当预测值与目标值相差 阅读全文

posted @ 2018-05-06 06:03 Wujunde 阅读(1287) 评论(0) 推荐(0) 编辑