ramlife

  博客园  :: 首页  :: 新随笔  :: 联系 :: 订阅 订阅  :: 管理

原理:

线性回归,本来就是在多个散点之间,拟合一个函数,这个函数和实际的值之间的偏差,就用 R2 来评估。
函数的值属于预测值,如果直接使用 预测值 - 实际值,然后求和,可能碰到正负相抵的情况,所以使用差值的平方然后求和。求和后的结果除以个数,就是 均方误差。
但是单纯的均方误差很难评价预测准确性,需要有另外一个来对比,才能体现出准确性。 用来对比的,最简单就是平均值,在坐标系中就是 一条水平线,也就是方差。
甚至我们可以这样来考虑,在散点图上,我有两条线,一条线是我精心拟合的(仔细计算系数),一条线是我粗暴拟合的(直接求平均),只要我精心拟合的和实际值之间的误差,对比我粗暴拟合的和实际值之间的误差,越小越好。

公式:

R2 = 1 - 均方误差 / 方差

均方误差: 实际值减去预测值的差值,先平方,然后求和,再平均。
方差:实际值减去平均值的差值,先平方,然后求和,再平均。

参考:

回归分析中相关指数R^2的探讨
https://zhuanlan.zhihu.com/p/158817889

R2系数浅析
https://blog.csdn.net/m0_46278903/article/details/113200083

辨析:方差 和 均方误差 的联系和区别
https://blog.csdn.net/lw200814/article/details/115700799

posted on 2022-08-31 15:49  ramlife  阅读(2873)  评论(0编辑  收藏  举报