Tensorflow2.0笔记09——激活函数

Tensorflow2.0笔记

本博客为Tensorflow2.0学习笔记，感谢北京大学微电子学院曹建老师

Tensorflow2.0笔记
- 3. 激活函数

3. 激活函数

激活函数是用来加入非线性因素的，因为线性模型的表达能力不够。引入非线性激活函数，可使深层神经网络的表达能力更加强大。

优秀的激活函数应满足：

非线性： 激活函数非线性时，多层神经网络可逼近所有函数

可微性：优化器大多用梯度下降更新参数

单调性： 当激活函数是单调的，能保证单层网络的损失函数是凸函数

近似恒等性：f(x) ≈x 。当参数初始化为随机小值时，神经网络更稳定激活函数输出值的范围：

激活函数输出为有限值时，基于梯度的优化方法更稳定激活函数输出为无限值时，建议调小学习率

常见的激活函数有：sigmoid，tanh，ReLU，Leaky ReLU，PReLU，RReLU，ELU（Exponential Linear Units），softplus，softsign，softmax等，下面介绍几个典型的激活函数：

3.1 sigmoid

TensorFlow API: tf.math.sigmoid

优点：

1. 输出映射在(0,1)之间，单调连续，输出范围有限，优化稳定，可用作输出层；

求导容易。

缺点：

易造成梯度消失；
输出非0均值，收敛慢；
幂运算复杂，训练时间长。

sigmoid函数可应用在训练过程中。然而，当处理分类问题作出输出时，sigmoid却无能为力。简单地说，sigmoid函数只能处理两个类，不适用于多分类问题。而softmax可以有效解决这个问题，并且softmax函数大都运用在神经网路中的最后一层网络中，使得值得区间在（0,1）之间，而不是二分类的。