线性回归小结

逐步前向线性回归

1.初始化系数为0,即zeros((特征数, 1))

2.每执行一次迭代,都要遍历每一个特征,针对每一个特征的系数,有两种取值情况,分别是[-1,1]两个方向的sign*step。

这样就确定了两个权重向量,然后将所有的训练样本*权重向量,获得训练样本的预测值;

3.将所有这些预测值与真实值,相减并平方后求和,就得到了所有训练样本针对该权重向量的一个误差值。

4.只保留最小误差所对应的权重向量就可以。

5.完成指定迭代之后,就可以得到具有最小误差所对应的权重系数。

 

小结:

每个特征依次乘以一个很小的迭代系数,然后从中选择出一个可以获得最小训练误差的方案,作为本次迭代的一个最优系数。

多次迭代之后,将会最终收敛到一个稳定的系数值。

 

 

岭回归

需要使用标准化的数据,获得权重之后,测试数据也要使用岭回归原始数据的均值和方差来标准化测试数据。

数据标准化(或者说归一化)的介绍:https://www.cnblogs.com/bjwu/p/8977141.html

 

posted @ 2020-08-25 14:47  绍荣  阅读(152)  评论(0编辑  收藏  举报