摘要: 参考:https://arxiv.org/pdf/1609.04747.pdf DL训练面临的典型困难 Mini-batch gradient descent 这是ML训练基本原理。一般不用直接梯度下降法就行训练 Momentum(动量法) 更新公式如下,其中η为学习率(一般为0.9),用法: Ne 阅读全文
posted @ 2019-01-02 15:49 xbit 阅读(160) 评论(0) 推荐(0) 编辑