摘要: 神经网络的参数学习是一个非凸优化问题,在使用梯度下降法进行网络参数优化时,参数初始值的选取十分关键,关系到网络的优化效率(梯度消失和梯度爆炸问题)和泛化能力(局部最优解问题)。 阅读全文
posted @ 2020-09-02 17:57 Hiidiot 阅读(1976) 评论(0) 推荐(0) 编辑