摘要: 目录 前言 1.adagrad 2.动量(Momentum) 3.RMSProp 4.Adam 附1 基于梯度的优化算法前后关系 附二 Gradient Descent补充 前言: https://www.zhihu.com/question/323747423/answer/790457991 A 阅读全文
posted @ 2020-01-07 16:40 rin_riceroll 阅读(2509) 评论(0) 推荐(1) 编辑