scikit-learn学习笔记(4)

Posted on 2017-02-23 11:30  不要半途而废  阅读(151)  评论(0编辑  收藏  举报

1.1.3 Lasso(Least absolute shrinkage and selection operator)

Lasso算法,又译为最小绝对值收敛和选择算子、套索算法,针对X是稀疏矩阵的情况,进行变量选择和规范化,以增加预测的准确性,最初是为最小二乘法而设计,然而lasso的正规化可以很容易的拓展到更多的统计模型中包括广义化线性模型等

在Lasso出现前,RR是最受欢迎的方法用于增加预测的准确性,RR通过减小回归系数来减少过度拟合来减少预测误差

 

 

Intercept就是y=bX+a里面的a,看之前的很多回归模型里面都是默认fit_intercept=True,我就查了查,这个intercept什么时候需要fit什么时候不需要,得到的答案简单的说就是,如果你通过研究认定这个模型会通过原点那么就不用fit,相当于y=bX,但是大多情况下不是如此,在ANOVA中有另外陈述