机器学习——激活函数理解

激活函数

作用：

如果不用激励函数（其实相当于激励函数是f(x) = x），在这种情况下你每一层节点的输入都是上层输出的线性函数，输出都是输入的线性组合，与没有隐藏层效果相当。
2线性的表达能力太有限了，即使经过多层网络的叠加，y=ax+b无论叠加多少层最后仍然是线性的，增加网络的深度根本没有意义。
对于y=ax+b 这样的函数，当x的输入很大时，y的输出也是无限大小的，经过多层网络叠加后，值更加膨胀的没边
引入非线性函数作为激励函数，这样深层神经网络表达能力就更加强大（不再是输入的线性组合，而是几乎可以逼近任意函数）。？：为什么非线性化后，增加网络就变得有意义？体现在哪里？

	TF调用	公式	图像	导数	优点	缺点
sigmoid		$S(x)=1/(1+e^{-x})$				梯度反向传递时导致梯度爆炸和梯度消失其中梯度爆炸发生的概率非常小而梯度消失发生的概率比较大。 sigmoid输出永远是正数;非零中心
tanh					输出（-1，1）	没有解决“梯度消失问题”
ReLU					不会有梯度消失问题	输入负数，则完全不激活，ReLU函数死掉
Leaky ReLU（LReLU）
ELU
Maxout
softmax