sigmoid单元:阈值输出是输入的连续函数--挤压函数
导数:
反向传播算法:
误差:
缓解局部极小值:
1.增加冲量
2.使用不同的随机权值初始化每个网络
解决过度拟合:
1.训练数据 验证数据
2.小数据集 k-fold 交叉验证
其他可选误差和最小化过程