Deep Learning 学习笔记（6）：神经网络( Neural Network )

神经元：

在神经网络的模型中，神经元可以表示如下

神经元的左边是其输入，包括变量x1、x2、x3与常数项1，

右边是神经元的输出

神经元的输出函数被称为激活函数（activation function），输出值被称为激活值（activation value）。

激活函数有很多种，其中最简单的莫过于sigmoid函数。

除非特别声明，否则博客里提及的激活函数均为sigmoid

神经网络：

多个神经元首尾相连连接成神经网络（Neural Network），可以表示如下：

尽管生物体中神经云之间的连接会更加复杂，

在常用的模型中，神经元的连接要遵循一定规则，

简单地来说就是要分层：上一层神经元的输出作为下一层的输入，

两层之间单向传递，没有反馈

同层之间的神经元没有交流。

下面我们来描述一下这个模型 :

神经网络 $\textstyle {n}_l$ 来表示网络的层数，

其中最左边的叫做出入层，最右边的称为输出层，中间的层被称为隐藏层

隐藏层的借点成为隐藏节点。隐藏层的数量为网络的“深度”

我们将第 $\textstyle l$ 层记为 $\textstyle L_l$ ，于是 $\textstyle L_1$ 是输入层，输出层是 $\textstyle L_{n_l}$ 。

本例神经网络有参数 $\textstyle (W,b) = (W^{(1)}, b^{(1)}, W^{(2)}, b^{(2)})$ ，

其中， $\textstyle W^{(l)}_{ij}$ （下面的式子中用到）是第 $\textstyle l$ 层第 $\textstyle j$ 单元与第 $\textstyle l+1$ 层第 $\textstyle i$ 单元之间的联接参数（权重，注意标号顺序），

$\textstyle b^{(l)}_i$ 是第 $\textstyle l+1$ 层第 $\textstyle i$ 单元的偏置项。

因此在本例中， $\textstyle W^{(1)} \in \Re^{3\times 3}$ ， $\textstyle W^{(2)} \in \Re^{1\times 3}$ 。

注意，即偏置单元没有输入

$\textstyle s_l$ 表示第 $\textstyle l$ 层的节点数，偏置单元不计在内

神经网络的计算：

用 $\textstyle a^{(l)}_i$ 表示第 $\textstyle l$ 层第 $\textstyle i$ 单元的激活值（输出值），当 $\textstyle l=1$ 时， $\textstyle a^{(1)}_i = x_i$

$\textstyle z^{(l)}_i$ 表示第 $\textstyle l$ 层第 $\textstyle i$ 单元输入加权和（包括偏置单元）

于是， $\textstyle h_{W,b}(x)$ 可以按如下方法计算

$\begin{align} a_1^{(2)} &= f(W_{11}^{(1)}x_1 + W_{12}^{(1)} x_2 + W_{13}^{(1)} x_3 + b_1^{(1)}) \\ a_2^{(2)} &= f(W_{21}^{(1)}x_1 + W_{22}^{(1)} x_2 + W_{23}^{(1)} x_3 + b_2^{(1)}) \\ a_3^{(2)} &= f(W_{31}^{(1)}x_1 + W_{32}^{(1)} x_2 + W_{33}^{(1)} x_3 + b_3^{(1)}) \\ h_{W,b}(x) &= a_1^{(3)} = f(W_{11}^{(2)}a_1^{(2)} + W_{12}^{(2)} a_2^{(2)} + W_{13}^{(2)} a_3^{(2)} + b_1^{(2)}) \end{align}$

计算过程可以用向量运算简化

这种由输入求输出，从左向右计算的算法，叫做前向传播算法

于是乎这种神经网络也叫做前馈神经网络

（完)

posted @ 2013-09-09 19:46 Pony_s 阅读(966) 评论(0) 收藏举报

刷新页面返回顶部

Pony_s

Deep Learning 学习笔记（6）：神经网络( Neural Network )

神经元：

神经网络：

神经网络的计算：

公告