反向传播过程中不可导情况处理
参考这篇文章:
https://blog.csdn.net/weixin_42720875/article/details/105936398
《神经网络反向求导不可导情况处理》
写的蛮好,主要写了Relu函数、平均池化、最大池化的处理方式。
Relu函数
次梯度方法(subgradient method)是传统的梯度下降方法的拓展,用来处理不可导的凸函数。它的优势是比传统方法处理问题范围大,劣势是算法收敛速度慢。但是,由于它对不可导函数有很好的处理方法,所以学习它还是很有必要的。
对于relu函数,当x>0时,导数为1,当x<0时导数为0。因此relu函数在x=0的次梯度c ∈ [ 0 , 1 ] c\in[0,1]c∈[0,1],c可以取[0,1]之间的任意值。
池化不可导
平均池
最大池化
下面还有一张图是一些常见激活函数的导数结果,可以简单看看。