BP
第1階段:激勵傳播
每次迭代中的傳播環節包含兩步:
(前向傳播階段)將訓練輸入送入網絡以獲得預測結果;
(反向傳播階段)對預測結果同訓練目標求差(損失函數)。
第2階段:權重更新
對於每個突觸上的權重,按照以下步驟進行更新:
將輸入激勵和響應誤差相乘,從而獲得權重的梯度;
將這個梯度乘上一個比例並取反後加到權重上。
這個比例(百分比)將會影響到訓練過程的速度和效果,因此成為「訓練因子」。梯度的方向指明了誤差擴大的方向,因此在更新權重的時候需要對其取反,從而減小權重引起的誤差。
第 1 和第 2 階段可以反覆循環迭代,直到網絡對輸入的響應達到滿意的預定的目標範圍為止。