折叠
摘要: 类神经网络的训练 局部最小值与鞍点 背景:随着参数更新,training loss没有下降到足够小或者压根没有下降趋势。人们推测是走到的这些地方参数对loss的微分为零时,梯度下降无法再updata参数。 gradient为零的两种情况(统称为临界点) 局部最小值:local minima,卡在此处 阅读全文
posted @ 2021-08-28 21:15 Coverpast 阅读(50) 评论(0) 推荐(0) 编辑