4-打开神经网络的大门

1. 神经网络的认识

用图来表示神经网络的话，如下图所示。我们把最左边的一列称为 输入层，最右边的一列称为输出层，中间的一列称为中间层，有时也称为隐藏层。

在这里插入图片描述

另外，也把输入层到输出层依次称为第0层、第 1层、第2层

2. 激活函数

激活函数是连接感知机和神经网络的桥梁。

像感知机原理公式
$y=\begin{cases} 0&(b+ω_1x_1+ω_2x_2\leq0)\\&&(2.1)\\ 1&(b+\omega_1x_1+\omega_2x_2>0) \end{cases}$
可以转换为
$h(x)=\begin{cases}0&&x\le0\\&&&(2.2)\\1&&x>0\end{cases}$
$h (x)$ 将输入信号的总和转换为输出信号，这样的函数就叫做激活函数

式（2.2）表示的激活函数以阈值为界，一旦输入超过阈值，就切换输出。这样的函数称为“阶跃函数, 也就是说，在激活函数的众多候选函数中，感知机使用了阶跃函数。

2.1 其他激活函数

sigmoid函数（sigmoid function）

$h(x)=\frac{1}{1+e^{-x}}$

神经网络中用sigmoid函数作为激活函数，进行信号的转换，转换后的信号被传送给下一个神经元。

实际上，上一章介绍的感知机和接下来要介绍的神经网络的主要区别就在于这个激活函数。其他方面，比如神经元的多层连接的构造、信号的传递方法等，基本上和感知机是一样的。
- 阶跃函数的实现
```
def step_function(x):    
    if x > 0:        
        return 1    
    else:       
        return 0
```
  这个实现简单、易于理解，但是参数x只能接受实数（浮点数）。
  
  也就是说，允许形如 step_function(3.0) 的调用，但不允许参数取NumPy数组，例如：step_function(np.array([1.0, 2.0]))。
  
  为了便于后面的操作，我们把它修改为支持NumPy数组的实现：
  
  代码1
```
def step_function(x):    
    y = x > 0    
    return y.astype(np.int)
```
  由于使用了NumPy中的“技巧”，可能会有点难理解，下面同过python解释器解释一下：
  
  代码2
```
>>> import numpy as np 
>>> x = np.array([-1.0, 1.0, 2.0])
>>> x 
array([-1.,  1.,  2.]) 

>>> y = x > 0
>>> y
array([False,  True,  True], dtype=bool)
```
  数组的各个元素都进行了不等号运算，生成一个布尔型数组（y），接下来，再把数组y的元素类型从布尔型转换为int型。
  
  代码3
```
>>> y = y.astype(np.int) 
>>> y 
array([0, 1, 1])
```
  这样，像代码1 就用python实现了一个阶跃函数。
- sigmoid函数的实现
```
def sigmoid(x):    #x可以是一个数字，也可以是numpy数组
    y = 1 / (1 + np.exp(-x))  #因为numpy数组具有广播功能
    return y
```
- sigmoid函数和阶跃函数的比较

在这里插入图片描述

异性

“平滑性”`不同：
- sigmoid函数是一条平滑的曲线，输出随着输入发生连续性的变化。
- 而阶跃函数以0为界，输出发生急剧性的变化。
- sigmoid函数的平滑性对神经网络的学习具有重要意义。
感知机中神经元之间流动的是0或1的二元信号，而神经网络中流动的是连续的实数值信号。

共性：

从宏观视角看，可以发现它们具有相似的形状。实际上，两者的结构均是“输入小时，输出接近0（为 0），随着输入增大，输出向1靠近（变成1）。
还有一个共同点是，不管输入信号有多小，或者有多大，输出信号的值都在0到1之间。
两者均为非线性函数。

$非线性函数]\\ 神经网络的激活函数必须使用非线性函数。因为使用线性函数的话，\\ 加深神经网络的层数就没有意义了。为什么这么说，线性函数的问题\\ 在于，不管如何加深层数，总是存在与之等效的“无隐藏层的神经网络”。\\ （稍微直观地）理解这一点，我们来思考下面这个简单的例子。这里我们\\ 考虑把线性函数h(x) = cx作为激活函数，把y(x) = h(h(h(x)))的运算\\对应3层神经网络A。这个运算会进行 y(x) = c×c×c×x的乘法运算，\\ 但是同样的处理可以由y(x) = ax（注意，a = c^3）这一次乘法运算（即没\\ 有隐藏层的神经网络）来表示。如本例所示，使用线性函数时，无法发挥多层\\网络带来的优势。因此，为了发挥叠加层所带来的优势，激活函数必须使用\\非线性函数$

ReLU函数

$h(x)=\begin{cases} x&x>0\\ 0&x\le0 \end{cases}$

python实现：
```
def relu(x):    #x 可以是一个数字、列表、numpy数组
    return np.maximum(0, x)
```
maximum()函数会从输入的数值中选择较大的那个值进行输出。

补充一个实现阶跃函数的方法：

使用 map() 函数
例如：

x = [-1,1,2,3,-4,0,-3]

y = map(lambda a: 1 if a > 0 else 0, x)
print(list(y))

#输出：
[0, 1, 1, 1, 0, 0, 0]

posted @ 2020-07-11 19:47 aJream 阅读(46) 评论(0) 收藏举报

刷新页面返回顶部

aJream

4-打开神经网络的大门

1. 神经网络的认识

2. 激活函数

2.1 其他激活函数

`sigmoid`函数（sigmoid function）

阶跃函数的实现

sigmoid函数的实现

sigmoid函数和阶跃函数的比较

异性

共性：

`ReLU`函数

补充一个实现阶跃函数的方法：

公告

aJream

4-打开神经网络的大门

1. 神经网络的认识

2. 激活函数

2.1 其他激活函数

sigmoid函数 （sigmoid function）

阶跃函数的实现

sigmoid函数的实现

sigmoid函数和阶跃函数的比较

异性

共性：

ReLU函数

补充一个实现阶跃函数的方法：

公告

`sigmoid`函数（sigmoid function）

`ReLU`函数