随笔分类 - 优化算法

梯度下降，Adam算法等

摘要：梯度下降法前提：固定学习率，两个函数和三个变量组成函数1：待优化函数f(x)；函数2：待优化函数f(x)的导数g(x)；变量x：函数中的变量，优化过程中会不断变化，直到它找到最小值；变量grad：变量x点处的梯度值；变量step：表示沿着梯度下降方法行进的步长，也被称为学习率（Learn 阅读全文

posted @ 2018-05-16 15:39 chamie 阅读(253) 评论(0) 推荐(0)