线性回归
回归分析:利用样本(已知数据),产生拟合方程,从而对(未知数据)进行预测
线性回归:一元线性回归;多元线性;广义线性
非线性回归分析
困难:选定变量(多元),避免多重共线性,观察拟合方程,避免过度拟合,检验模型是否合理
关系
函数关系:确定性关系
相关关系:非确定性关系
相关系数:使用相关系数衡量线性相关的强弱
一元线性回归
Y=a+bX+r
如何确定参数
使用误差平方和衡量预测与真实值得差距,寻找合适的参数,是平方误差和RSS最小
最小二乘法:由于a、b的二次项系数都为负数,分别对a、b求偏导等于0出的值即为RSS最小值
一元线性回归分析
步骤:建立回归模型,求解参数,回归模型检验
plot(w~h+1) -- +1代表截距项
做回归直线
lines(h,a+b*h)
回归系数假设检验
建立线性模型
a=lm(w~1+h)
线性模型的汇总数据,t检验,summary函数
结果描述:残差的最小值,下四分卫数,中位数,上四分位数,最大值,t值,t值置信区间
相关系数平方
F检验值
显著性标记:极度、高度、显著、不太显著,不显著
计算残差平方和
预测
方差分析,函数anova()
内推插值
多元线性回归模型
哑变量
加法模型
乘法模型
逐步回归 step函数 AIC准则、BIC准则
向前引用发
向后剔除法
逐步筛选法
add1()
drop1()
修正拟合模型
update函数
回归诊断