2019年12月9日

特征缩放和标准化 设置学习率大小 正则方程

摘要: 标准化到相近的范围即可 这是因为θ在小范围内下降很快,在大范围内下降很慢,所以当变量非常不均匀时,θ会低效率地振荡到最优。(特征都在一个相近的范围,这样梯度下降法就能更快的收敛) 用X轴上的迭代次数绘制一个图。现在绘制成本函数,J(θ)在梯度下降迭代次数上。如果J(θ)增大,那么可能需要减小α。 总 阅读全文

posted @ 2019-12-09 20:44 cltt 阅读(196) 评论(0) 推荐(0) 编辑

导航