BP

第1階段：激勵傳播
每次迭代中的傳播環節包含兩步：

（前向傳播階段）將訓練輸入送入網絡以獲得預測結果；
（反向傳播階段）對預測結果同訓練目標求差(損失函數)。
第2階段：權重更新
對於每個突觸上的權重，按照以下步驟進行更新：

將輸入激勵和響應誤差相乘，從而獲得權重的梯度；
將這個梯度乘上一個比例並取反後加到權重上。
這個比例（百分比）將會影響到訓練過程的速度和效果，因此成為「訓練因子」。梯度的方向指明了誤差擴大的方向，因此在更新權重的時候需要對其取反，從而減小權重引起的誤差。