摘要: SGD : stochastic gradient descent (随机梯度下降) 1. 更新比较频繁,会造成 cost function 有严重的震荡,最终停留在 local minima (极小值) 或 saddle point (鞍点) 处 SGDM : SGD with Momentum 阅读全文
posted @ 2018-08-01 16:21 cbattle 阅读(402) 评论(0) 推荐(0) 编辑