摘要: 第七讲、最优化 1.优化目标 2.梯度下降 ①batch ②随机梯度下降SGD 训练一个样本,更新—次参数; mini-batch是SGD的推广,通常所说SGD即是mini-batch。 ③病态条件 病态条件:不同方向有不同的梯度;学习率的选择困难。 ④局部最小 局部最小(local minima) 阅读全文
posted @ 2021-02-01 20:47 利威尔 阅读(57) 评论(0) 推荐(0) 编辑