摘要:
要判断Stochastic Gradient Descent是否收敛,可以像Batch Gradient Descent一样打印出iteration的次数和Cost的函数关系图,然后判断曲线是否呈现下降且区域某一个下限值的状态。由于训练样本m值很大,而对于每个样本,都会更新一次θ向量(权重向量),因此可以在每次更新θ向量前,计算当时状况下的cost值,然后每1000次迭代后,计算一次average cost的值。然后打印出iteration和cost之间的关系。1、不同曲线图代表的含义及应对策略可能会看到的曲线图有如下几种:情况1这样的曲线说明算法已经收敛。如果我们使用小一点的学习率α,那.. 阅读全文