线性回归

回归分析:利用样本(已知数据),产生拟合方程,从而对(未知数据)进行预测

  线性回归:一元线性回归;多元线性;广义线性

  非线性回归分析

  困难:选定变量(多元),避免多重共线性,观察拟合方程,避免过度拟合,检验模型是否合理

  关系

    函数关系:确定性关系

    相关关系:非确定性关系

      相关系数:使用相关系数衡量线性相关的强弱

  一元线性回归

    Y=a+bX+r

    如何确定参数

      使用误差平方和衡量预测与真实值得差距,寻找合适的参数,是平方误差和RSS最小

      最小二乘法:由于a、b的二次项系数都为负数,分别对a、b求偏导等于0出的值即为RSS最小值

  一元线性回归分析

    步骤:建立回归模型,求解参数,回归模型检验

    plot(w~h+1)  -- +1代表截距项

    做回归直线

      lines(h,a+b*h)

    回归系数假设检验

    建立线性模型

      a=lm(w~1+h)

    线性模型的汇总数据,t检验,summary函数

    结果描述:残差的最小值,下四分卫数,中位数,上四分位数,最大值,t值,t值置信区间

    相关系数平方

    F检验值

    显著性标记:极度、高度、显著、不太显著,不显著

    计算残差平方和

    预测

    方差分析,函数anova() 

    内推插值

 

  多元线性回归模型

    哑变量

    加法模型

    乘法模型

    逐步回归 step函数 AIC准则、BIC准则

      向前引用发

      向后剔除法

      逐步筛选法

      add1()

      drop1()

    修正拟合模型

    update函数

    

  回归诊断

 

  

    

    

 

    

 

posted @ 2018-05-21 17:11  geek_ace  阅读(209)  评论(0编辑  收藏  举报