摘要: 数据预处理: 一般用0均值化数据,若所有输入都是正的,则得到权重上的梯度也都是正的,会得到次最优的优化梯度 通过标准差来归一化 初始化权重: 如果以0(或相同的值)为所有权重的初始值,会导致所有的神经元将做同样的事,每个神经元将在输入数据上有相同的操作输出相同的值,得到相同的梯度,参数更新也相同,得 阅读全文
posted @ 2019-06-12 11:35 Manuel 阅读(480) 评论(0) 推荐(0) 编辑