2019 年 6月 12 日随笔档案 - Manuel

2019年6月12日

摘要：数据预处理：一般用0均值化数据，若所有输入都是正的，则得到权重上的梯度也都是正的，会得到次最优的优化梯度通过标准差来归一化初始化权重：如果以0（或相同的值）为所有权重的初始值，会导致所有的神经元将做同样的事，每个神经元将在输入数据上有相同的操作输出相同的值，得到相同的梯度，参数更新也相同，得阅读全文

posted @ 2019-06-12 11:35 Manuel 阅读(488) 评论(0) 推荐(0) 编辑