CNN / RNN

CNN / RNN


CNN

人均985的知乎上说:降维,融合一切的降维。

结构

  • 各种预处理
  • n层处理
    • n层处理
      • CONV:卷积计算层,线性乘积求和。
      • RELU:一种对图像识别比较友好的激活函数。
    • POOL:池化层,简言之,即取区域平均或最大或者其他方法。
  • FC:全连接层,用于分类回归。
graph LR a["去均值\归一化\PCA\白化"]-->b["n层CONV+RELU"] c["POOL"]-->d["FC"] subgraph n层 b-->c end

RNN

经典结构 - Elman

计算图

图中递归结构w为前段时间隐藏层的输出。注意,计算图展开后权值共享,更新参数时需要同步更新所有值。实际运用过程中还分为

![fig1][fig1]

训练方式:BPTT

按照时间线展开特定次数,然后按照BPTT算法逐步更新,每次更新权值时要使之前的所有层次的权值进行相同更新。

fig2

NARX

结构

不局限于当前时间至上一个时刻的相同权值递归,而是采用一定范围内时刻数据进行不同权值递归。不局限于隐藏层自递归,而是将输出结果递归作为输入。训练方式:还是按时序展开,BPTT。

变体 - NARX Series-Parallel

使用并行结构,即训练时输入直接采用标准输出训练,而不是采用生成的预期输出。训练方式:直接BP就可以,训练比原始模型要快速很多。

双向RNN

结构

思想:同时考虑过去和未来数据对当前的影响。不仅有向后的权值,还存在向前的权值。训练方式也为BPTT。

变体 - 深层双向RNN

设计初衷:一次记不下来啊,需要多记几次。

LSTM

结构

解决了RNN梯度消失问题,即难以更新较前位置的权值。

经典模型只有输入门与输出门,最新的模型添加了遗忘门。设计核心是递归输出权值设定为1,此节点简称为细胞。细胞前后存在输入门与输出门加权,递归输入存在遗忘门加权。三个门和总体加权输入包括原始输入、总体输出、细胞输出三个部分。

训练算法

可以参考未来的大佬Alex Graves写的一本书《Supervised Sequence Labelling with Recurrent Neural Networks》,也可以参考LSTM开山之作《LONG SHORT-TERM MEMORY》,就不再抄一遍了。

GRU

结构

LSTM的平民版,使用了同一个门控就同时可以进行遗忘和选择记忆,更容易进行训练,能够很大程度上提高训练效率。

ps:

  • RNN还要考虑时间尺度问题,衍生出MTRNN
  • 如果时间间隔不同的话,需要特殊处理,比如将时间间隔作为参数控制遗忘门(未经过实验的想法)。
  • 一般性结论:只要大佬您能把权值更新算法计算出来,😅结构开心就好~

©️ Copyrights.RSMX.GUILIN.2020-05-17

[fig1]:

posted @ 2020-05-10 12:26  若水茗心  阅读(1247)  评论(0编辑  收藏  举报