摘要: sigmoid 容易出现gradient vanishing 函数输出并不是zero-centered 幂运算相对来讲比较耗时 容易出现gradient vanishing 函数输出并不是zero-centered 幂运算相对来讲比较耗时 Gradient Vanishing 优化神经网络的方法是B 阅读全文
posted @ 2017-03-04 13:22 simple_wxl 阅读(2874) 评论(1) 推荐(0) 编辑