摘要: AdaGrad全称是Adaptive Gradient Algorithm,是标准Gradient Descent的又一个派生算法。标准Gradient Descent的更新公式为: 其中Learning Rate α对于Cost Function的各个feature都一样,但同一个α几乎不可能在各 阅读全文
posted @ 2018-07-11 15:52 Junfei_Wang 阅读(1114) 评论(0) 推荐(0) 编辑