摘要: Adam: 一个随机优化方法 https://arxiv.org/pdf/1412.6980.pdf 摘要 我们基于低阶矩(lower-order moments)的自适应估计提出Adam算法来解决随机目标函数的基于一阶梯度的优化。该方法易于实现,计算效率高,对内存要求低,不随梯度的对角线重缩放发生 阅读全文
posted @ 2021-01-20 21:06 YoungF 阅读(741) 评论(0) 推荐(0) 编辑