吴恩达深度学习课程第二课-改善深层神经网络

第一周深度学习的实用层面

1.1 训练，配置，测试训练集

学习完如何构建神经网络,接下来学习如何高效运行神经网络
数据集划分: train,dev,test: 在train中训练模型,利用dev选择最佳模型,利用test测试最终模型

1.2 偏差Bias，方差Variance

欠拟合(高偏差),过拟合(高方差)

1.3 处理欠拟合，过拟合方案

1.4 正则化Regularization

1.5 为什么正则化可以解决过拟合

L2正则项将许多隐藏单元的影响减少了

1.6 dropout正则化

1.7 dropout的理解

计算机视觉领域，经常数据过少，容易产生过拟合，默认使用dropout方法

1.8 其他正则化方法

通过编码基于原数据增加训练数据
提前终止训练

1.9 归一化输入

使用u实现0均值化,使用sgma实现方差1，使用相同u,sgma变换训练集，测试集，验证集
归一化有利于代价函数更快找到最优解

1.10 梯度消失与梯度爆炸

对于深度神经网络,多项权重相乘,如果都小于1会使得梯度接近0(消失),如果都大于1,会使得梯度非常大(爆炸)
梯度爆炸导致权重跟新幅度大，梯度消失导致权重跟新缓慢

1.11 神经网路的权重初始化

可以不彻底的解决梯度消失与爆炸问题
借用高斯分布随机数初始化权重

1.12 梯度的数值逼近

1.13 梯度检验

矩阵转一个大向量
双边检验梯度，用欧氏距离检测近似度

1.14 梯度检验实现的技巧

第二周优化算法

2.1 mini-batch 梯度下降

2.2 理解小批量梯度下降

2.3 指数加权平均

2.4 理解指数加权平均数

2.5 指数加权的偏差修正

2.6 动量梯度下降法

2.7 RMSprop

2.8 Adam优化算法

结合动量和RMSprop算法

2.9 学习率衰减

随时间进行减小学习率

2.10 局部最优问题

第三周超参数调试,batch正则化和程序框架

3.1 调试处理

随机选择分布的超参数进行调试
先缩小区域，在小区域内寻找

3.2 为超参数选择合适的范围

网格均匀选取
随机取值
取值逐渐精细

3.3 超参数训练的实践Pandas VS Caviar

偶然灵感寻找超参数
观察模型调整：数据多使用第一个，数据少使用第二个

3.4 正则化网络的激活函数

归一化有利于网络训练

3.5 将Batch norm 拟合神经网络

3.6 Batch Norm有效

归一化所有输入特征使其均值为0方差为1可以加速神经网络得学习

改变数据的分布
使网络层更加稳定,有轻微的正则化效果

3.7 测试时的Batch Norm

3.8 softmax回归

进行除了2分类的多分类问题
4个分类输出四个分类的概率
将输出Z转换为和为1的0-1之间的映射即是概率
单层逻辑回归的神经网络模型就是线性划分模型

3.9 训练一个softmax分类器

3.10 深度学习框架

3.11 TensorFlow

posted @ 2019-12-29 10:14 -Rocky- 阅读(310) 评论(0) 编辑收藏举报

刷新页面返回顶部