Q:在Excel的图表中添加趋势线以后,可以在趋势线的选项中设置显示趋势线公式和R平方值,这个R平方值是什么意思?有何用途?
A:R平方值是趋势线拟合程度的指标,它的数值大小可以反映趋势线的估计值与对应的实际数据之间的拟合程度,拟合程度越高,趋势线的可靠性就越高。
R平方值是取值范围在0~1之间的数值,当趋势线的 R 平方值等于 1 或接近 1 时,其可靠性最高,反之则可靠性较低。R平方值也称为决定系数。
在统计学中,R平方值的计算方法如下:
R平方值=回归平方和(ssreg)/总平方和(sstotal)
其中回归平方和=总平方和-残差平方和(ssresid)
以上几个名词解释如下:
总平方和:Const参数为True的情况下,总平方和=y的实际值与平均值的平方差之和;Const参数为False的情况下,总平方和=y的实际值的平方和。
残差平方和:残差平方和=y的估计值与y的实际值的平方差之和。
用回归方程或回归线来描述变量之间的统计关系时,实验值yi与按回归线预测的值Yi并不一定完全一致,即各实验点(xi,yi)并不一定都落在回归线上,各实验点偏离回归线的程度,可用它们的总偏差平方和(总平方和)SST(sum of squares for total)来表征,SST=∑(yi-Yi)+∑(Yi-y),其中y是各实验值yi的平均值。SSR(sum of squares for regression)=∑(Yi-y)称为回归平方和,SSE (sum of squares for error)=∑(yi-Yi)称为残差平方和。残差平方和越小,自变量与因变量之间的相关性越好。
在线性回归分析中,可以使用RSQ函数计算R平方值。
RSQ函数语法为RSQ(known_y's,known_x's)
将源数据中的y轴数据和x轴数据分别代入,就可以求得其“线性”趋势线的R平方值。
参考来源: