RNN里的dropout
今天看到RNN代码里面有dropout,查了一下,有下面的说法
https://blog.csdn.net/xinyihhh/article/details/122135986
model.add(LSTM(100, dropout=0.2, recurrent_dropout=0.2))
model.add(Dropout(0.5))
第一个dropout是输入层x和hidden之间的dropout,控制输入线性变换的神经元断开比例
第二个recurrent_dropout是hidden-hidden之间的dropout(循环层之间),控制循环状态的线性变换的神经元断开比例
第三个Dropout是在层之间加入dropout层,是层与层之间的dropout
另外也有地方说RNN的权重存在累乘效应,如果使用dropout的话,会破坏RNN的学习过程。
https://blog.csdn.net/zhou_438/article/details/108577209
Google Brain在15年专门发表了一篇文章研究这个:recurrent neural network regularization
他们在非循环阶段使用了dropout,改善了过拟合的现象
论文在两个地方使用了dropout,图中虚线部分就是使用了dropout,实线部分没有使用
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· 被坑几百块钱后,我竟然真的恢复了删除的微信聊天记录!
· 没有Manus邀请码?试试免邀请码的MGX或者开源的OpenManus吧
· 【自荐】一款简洁、开源的在线白板工具 Drawnix
· 园子的第一款AI主题卫衣上架——"HELLO! HOW CAN I ASSIST YOU TODAY
· Docker 太简单,K8s 太复杂?w7panel 让容器管理更轻松!
2018-04-17 面试题 - 求两个节点的最低公共父节点
2018-04-17 xgboost总结
2017-04-17 PCA的代码
2017-04-17 FP-growth算法
2017-04-17 Apriori关联规则挖掘
2017-04-17 二分Kmeans聚类法 & 在地图上面找聚会点
2017-04-17 聚类及Kmeans