摘要: 第三周:浅层神经网络(Shallow neural networks) 1、激活函数(Activation functions) sigmoid函数和tanh函数两者共同的缺点是,在z特别大或者特别小的情况下,导数的梯度或者函数的斜率会变得特别小,最后就会接近于0,导致降低梯度下降的速度。 Relu 阅读全文
posted @ 2018-12-09 22:08 kamekin 阅读(298) 评论(0) 推荐(0) 编辑