摘要: 动量优化 想象一下,一个保龄球在光滑的表面上沿着平缓的坡度滚动:它开始速度很慢,在很快会获得动量,直到最终达到终极速度(如果有摩擦或空气阻力)。相比之下,常规的梯度下降法只是在斜坡上采取小的、常规的步骤,因此算法将花费更多时间到达底部 回想一下梯度下降通过直接减去权重的成本函数$J(\theta)\ 阅读全文
posted @ 2021-09-30 09:13 里列昂遗失的记事本 阅读(210) 评论(0) 推荐(0) 编辑