吴恩达机器学习笔记3-应对模型误差
一、术语
1、欠拟合与过拟合:
欠拟合:模型预测数据与实际数据相差太大(图1-1左边);
过拟合:模型预测结果对于现有实的际数据有很好的准确度,但模型不能推广应用到其它新数据(图1-1右边);
【图1-1】
2、训练集、验证集、测试集:
训练集:训练数据,用以梯度下降,使得误差最小化;
验证集:测试当前模型的准确率,我们由此调节迭代次数、学习率...;
测试集:用以最后测试准确率的数据集;
3、正则化:
限制目标函数,以免过拟合;
4、偏差、方差
偏差:预测结果与实际的误差;
方差:模型对不同批的同类型数据(例如 训练集、验证集),输出结果的波动程度;
二、应对方法与问题纵览
1、获取更多训练数据——高方差(过拟合);
2、减少特征值——高方差(过拟合);
3、增加特征值——高偏差(欠拟合);
4、缩小正则化项中的λ——高偏差(欠拟合);
5、增大正则化项中的λ——高方差(过拟合);
三、线性回归代价函数正则化公式
其中,J(θ)为代价函数,x,y为训练数据,θ为模型参数,式子末尾的正则化项是用来缩小每一个参数的。
过拟合出现的原因是模型函数过于复杂,当加上一个正则化项后,可以很好地控制参数的大小,简化模型。
当λ越大,会使得参数越小,则模型函数会更加简化,从而模型易于推广、泛化。
四、逻辑回归代价函数正则化公式
五、诊断方差、偏差
记 训练集产生的代价(误差)—— J(θ)train,验证集产生的代价(误差)—— J(θ)cv
总体方法是把 J(θ)train与 J(θ)cv比较:若J(θ)train与J(θ)cv都大,说明模型函数欠拟合,产生高偏差,预测得不够准确;
若J(θ)train远远小于J(θ)cv说明模型函数过拟合,产生高方差,模型函数推广泛化性差。如图5-1
【图5-1】