返回顶部
摘要: softMax层反向传播图如图所示,这里我们将图中-ti/yi的反向传播泛化为Li,方便我们的推导。 这里我们规定S=exp(a1)+...+exp(an) , yi=exp(ai)/S "乘"节点 有两个分支,对于向上的分支:Li*exp(ai) 然后将所有分支相加: ∑Li*exp(ai) 对于 阅读全文
posted @ 2021-10-20 13:06 #wr 阅读(658) 评论(0) 推荐(0) 编辑
         1 2 3