摘要: (一)引入—梯度下降算法 1. 线性假设: 2. 方差代价函数: 3. 梯度下降: 4. : learning rate (用来控制我们在梯度下降时迈出多大的步子,值较大,梯度下降就很迅速) 值过大易造成无法收敛到minimum(每一步迈更大) 值较小且适宜的情况下,步子越来越小直到收敛(导数项为零 阅读全文