吴恩达机器学习笔记24-神经网络的模型表示1(Model Representation of Neural Network I)

　　神经网络模型建立在很多神经元之上，每一个神经元又是一个个学习模型。这些神经元
（也叫激活单元，activation unit）采纳一些特征作为输出，并且根据本身的模型提供一个输
出。下图是一个以逻辑回归模型作为自身学习模型的神经元示例，在神经网络中，参数又可
被成为权重（weight）。

我们设计出了类似于神经元的神经网络，效果如下：

其中𝑥1, 𝑥2, 𝑥3是输入单元（input units），我们将原始数据输入给它们。
𝑎1, 𝑎2, 𝑎3是中间单元，它们负责将数据进行处理，然后呈递到下一层。
最后是输出单元，它负责计算ℎ𝜃(𝑥)。

　　神经网络模型是许多逻辑单元按照不同层级组织起来的网络，每一层的输出变量都是下
一层的输入变量。下图为一个3 层的神经网络，第一层成为输入层（Input Layer），最后一
层称为输出层（Output Layer），中间一层成为隐藏层（Hidden Layers）。我们为每一层都增
加一个偏差单位（bias unit）：

下面引入一些标记法来帮助描述模型：

代表第𝑗 层的第 𝑖 个激活单元。𝜃(𝑗)代表从第 𝑗 层映射到第𝑗 + 1 层时的权重的矩

阵，例如𝜃(1)代表从第一层映射到第二层的权重的矩阵。其尺寸为：以第 𝑗 + 1层的激活单
元数量为行数，以第 𝑗 层的激活单元数加一为列数的矩阵。例如：上图所示的神经网络中
𝜃(1)的尺寸为 3*4。
对于上图所示的模型，激活单元和输出分别表达为：

　　上面进行的讨论中只是将特征矩阵中的一行（一个训练实例）喂给了神经网络，我们需
要将整个训练集都喂给我们的神经网络算法来学习模型。
　　我们可以知道：每一个𝑎都是由上一层所有的𝑥和每一个𝑥所对应的Θ决定的。
（我们把这样从左到右的算法称为前向传播算法( FORWARD PROPAGATION )）
把𝑥, 𝜃, 𝑎 分别用矩阵表示，我们可以得到𝜃 ⋅ 𝑋 = 𝑎 ：

posted @ 2019-02-20 11:40 NeoML 阅读(486) 评论(0) 编辑收藏举报

会员力量，点亮园子希望

刷新页面返回顶部

千里的博客

吴恩达机器学习笔记24-神经网络的模型表示1(Model Representation of Neural Network I)

公告