python数据分析之线性回归,各种检验和解决方法!

Posted on 2018-01-21 15:19  糖馅味  阅读(30423)  评论(1编辑  收藏  举报

线性回归

(1)线性回归的主要内容:

有兴趣可以玩一下这个游戏:是猜相关系数的,给你一些散点图,猜相关系数,很难猜对,说明看图说明相关性不靠谱!

(2)线性回归怎么做?数学公式

一个简单线性回归的例子:

ols:

 

 

 

拟合优度:

(3) 假设检验

 

线性回归这位老师用的是statsmodels做的。

这就是用线性回归拟合出来的模型!

使用这个函数可以直接得到模型的一些结果,会得到这些表!

这个是预测的函数:predict(x)。这是这个包的函数!

 

二、多元线性回归

也可以用向量的方式。

参数是迭代计算的,此处不讲了。

模型的检验

只用与 模型的选择 调整的r方。避免的样本量的影响,预防过拟合!

python中的实现 试用stats model 多个变量用+连一起!

模型的一些值

变量的筛选,除了常规的,就是使用相前,向后还有逐步,还有全子集的方法。

不多介绍,上篇也讲过。

python需要自己写来实现,当然我不会,这里可以用spss去实现

这是python代码

 

 

跳过。。。

回归的假设。

线性

强影响点筛选,然后直接删除

 

 

 

 

强烈建议用spss进行多元线性回归建模。不过为了熟悉python明天打算用python更着去实现。

自己整理一下,多元线性回归的检验方法:

整体显著性检验:回归模型出来时候,可以之间看整体的F检验的p值

拟合优度检验:最简单的就看R方和调整的R方

系数检验:T检验结果,可以直接看P值

自相关检验:dw检验用得最多

异方差检验:Goldfeld - Quandt 检验法,这个方法挺好的的。其实还有其他检验方法,解决办法是建议取对数

共线性检验:vif值

 

 不够细,明日具体操作的时候会细点!