调试梯度下降。用x轴上的迭代数绘制一个图。现在测量成本函数,J(θ)随迭代次数下降。如果J(θ)不断增加,那么你可能需要减少α。

 

自动收敛试验。如果该声明收敛(θ)小于E在一次迭代中减少,其中E是一些小的值,如10−3。然而,在实践中很难选择这个阈值。

 

它已被证明,如果学习率α足够小,那么J(θ)每次迭代都减小。

 

总结:
如果α太小,收敛速度慢
如果α太大:可能不会在每次迭代不收敛,从而降低。

 

posted on 2017-07-23 14:18  郑哲  阅读(214)  评论(0编辑  收藏  举报