【2020春】李宏毅机器学习(Gradient Descent)
https://www.bilibili.com/video/av94519857?p=5
https://www.bilibili.com/video/av94519857?p=6
https://www.bilibili.com/video/av94519857?p=7
为什么SGD比GD收敛更快?
Feature Scaling
GD的数学
GD的限制
- stuck at saddle point
- stuck at local minima
- very slow at the plateau
找我内推: 字节跳动各种岗位
作者:
ZH奶酪(张贺)
邮箱:
cheesezh@qq.com
出处:
http://www.cnblogs.com/CheeseZH/
*
本文版权归作者和博客园共有,欢迎转载,但未经作者同意必须保留此段声明,且在文章页面明显位置给出原文连接,否则保留追究法律责任的权利。