交叉熵损失函数
的每一维 表示的是网络给出的样本 x属于第 i类的概率。给定样本(x,y) ,其中 是one-hot向量.
对于分类问题,也就是 ,并且使用交叉熵损失函数 时,输出层的误差项 到底是个什么形式
方法一:
根据法则 可得
所以,
根据恒等式
可得
所以. 其称之为输出误差项
方法二:
https://www.cnblogs.com/Determined22/p/6562546.html
交叉熵的解释: https://blog.csdn.net/u014380165/article/details/77284921