【510】NLP实战系列（七）—— 进阶版(dropout/stacking/BiLSTM)

　　进阶版包含以下技术：

Recurrent dropout（循环 dropout）, a specific, built-in way to use dropout to fight overfitting in recurrent layers.
- 使用 dropout 正则化的网络需要更长的时间才能完全收敛，因此网络训练轮次要增加为原来的 2 倍。　　
Stacking recurrent layers（堆叠循环层）, to increase the representational power of the network (at the cost of higher computational loads).
- 在 keras 中逐个堆叠循环层，所有中间层都应该返回完整的输出序列（一个 3D 张量），而不是只返回最后一个时间步的输出。这个可以指定 return_sequences=True 来实现。
Bidirectional recurrent layers（双向循环层）, which presents the same information to a recurrent network in different ways, increasing accuracy and mitigating forgetting issues.
- 需要使用 Bidirectional 层，它的第一个参数是一个循环层实例。Bidirectional 层对这个循环层创建了第二个单独实例，然后使用一个实例按正序处理输入序列，另一个实例按逆序处理输入序列。

1. Bidirectional 层

1.1 语法

1	`keras.layers.Bidirectional(layer, merge_mode='concat', weights=None)`

1.2 参数

layer: Recurrent 实例。
merge_mode: 前向和后向 RNN 的输出的结合模式。为 {'sum', 'mul', 'concat', 'ave', None} 其中之一。如果是 None，输出不会被结合，而是作为一个列表被返回。

2. 举例

2.1 Recurrent dropout

from keras.layers import LSTM
 
model = Sequential()
model.add(Embedding(max_features, 32))
model.add(LSTM(32,
               dropout=0.2,
               recurrent_dropout=0.2))
model.add(Dense(1, activation='sigmoid'))
 
model.compile(optimizer='rmsprop',
              loss='binary_crossentropy',
              metrics=['acc'])
history = model.fit(input_train, y_train,
                    epochs=20,
                    batch_size=128,
                    validation_split=0.2)

2.2 Stacking recurrent layers

from keras.layers import LSTM
 
model = Sequential()
model.add(Embedding(max_features, 32))
model.add(LSTM(32,
               dropout=0.2,
               recurrent_dropout=0.2,
               return_sequences=True))
model.add(LSTM(32,
               dropout=0.2,
               recurrent_dropout=0.2))
model.add(Dense(1, activation='sigmoid'))
 
model.compile(optimizer='rmsprop',
              loss='binary_crossentropy',
              metrics=['acc'])
history = model.fit(input_train, y_train,
                    epochs=20,
                    batch_size=128,
                    validation_split=0.2)

2.3 Bidirectional recurrent layers

from keras.layers import LSTM
from keras.layers import Bidirectional
 
model = Sequential()
model.add(Embedding(max_features, 32))
model.add(Bidirectional(LSTM(32,
                             dropout=0.2,
                             recurrent_dropout=0.2,
                             return_sequences=True)))
model.add(Bidirectional(LSTM(32,
                             dropout=0.2,
                             recurrent_dropout=0.2)))
model.add(Dense(1, activation='sigmoid'))
 
model.compile(optimizer='rmsprop',
              loss='binary_crossentropy',
              metrics=['acc'])
history = model.fit(input_train, y_train,
                    epochs=5,
                    batch_size=128,
                    validation_split=0.2)

posted on 2020-12-28 10:27 McDelfino 阅读(336) 评论(0) 编辑收藏举报

刷新页面返回顶部

登录后才能查看或发表评论，立即登录或者逛逛博客园首页

阅读排行：
· DeepSeek 开源周回顾「GitHub 热点速览」
· 记一次.NET内存居高不下排查解决与启示
· 物流快递公司核心技术能力-地址解析分单基础技术分享
· .NET 10首个预览版发布：重大改进与新特性概览！
· .NET10 - 预览版1新功能体验（一）

历史上的今天：
2017-12-28 【282】◀▶ arcpy.mapping 常用函数说明
2017-12-28 【281】◀▶ arcpy.mapping 常用类说明

alex_bn_lee

导航

公告

统计

搜索

常用链接

最新随笔

我的标签

积分与排名

随笔分类 (1762)

随笔档案 (1207)

相册 (9)

阅读排行榜

评论排行榜

推荐排行榜

最新评论

【510】NLP实战系列（七）—— 进阶版(dropout/stacking/BiLSTM)

1. Bidirectional 层

1.1 语法

1.2 参数

2. 举例

2.1 Recurrent dropout

2.2 Stacking recurrent layers

2.3 Bidirectional recurrent layers