2019 年 1月 2 日随笔档案 - xbit

2019年1月2日

摘要：参考：https://arxiv.org/pdf/1609.04747.pdf DL训练面临的典型困难 Mini-batch gradient descent 这是ML训练基本原理。一般不用直接梯度下降法就行训练 Momentum（动量法）更新公式如下，其中η为学习率（一般为0.9），用法： Ne 阅读全文

posted @ 2019-01-02 15:49 xbit 阅读(160) 评论(0) 推荐(0) 编辑

xbit

公告