摘要: 学习率的作用 学习率是梯度下降的重要参数,可以直接影响学习效果。 在梯度下降公式中 \[w=w-\alpha\frac{d}{dw}J(w) \]\(\alpha\)就是学习率,决定了每次更新的“步幅”。 如果学习率太小,权重更新过慢,则需要很多步才能达到损失函数最小值。如果学习率过大,权重会更新的 阅读全文
posted @ 2024-05-08 20:33 RubySIU 阅读(56) 评论(0) 推荐(0) 编辑