摘要: 目标: 怎么训练很深的神经网络 然而过深的神经网络会造成各种问题,梯度消失之类的,导致很难训练 作者利用了类似LSTM的方法,通过增加gate来控制transform前和transform后的数据的比例,称为Highway network 至于为什么会有效...大概和LSTM会有效的原因一样吧。 方 阅读全文
posted @ 2018-01-12 09:50 陈泽泽 阅读(1332) 评论(1) 推荐(0) 编辑