回归分析效果度量
问题:做一个简单线性回归和多元线性回归模型,怎么来度量这个模型呢?
回答:
数据符号 | 含义 |
yi | 实际观测值 |
Ÿ | 观测平均值 |
Ý | 预测值 |
#Y中总的离差平方和
SST=∑(yi-Ÿ)2
#回归平方和
SSR=∑(Ýi-Ÿ)2
#SSE残差平凡和
SSE=∑(yi-Ýi)2
在图中关系:
在线性[简单还是多元]回归中有:
SST=SSR+SSE
yi=Ý-(yi-Ý)[观测值=拟合值+残差]
yi-Ÿ=(Ý-Ÿ)+(yi-Ý)
Y的总的离差平方和可以分解成两部分
1.第一部分SSR 它度量了X的作用
2.SSE 它度量了预测的误差
R2=SSR/SST=1-SSE/SST
可以证明:
[Cor(Y,Ý)]2=R2
SSE<=SST 故:0<=R2<=1
若R2靠近1,则Y的绝大部分变异可由X解释。