【回归分析】[9]--加权最小二乘法
[回归分析][9]--加权最小二乘法
这一节会讲一下关于加权最小二乘法,这种方法是用来处理 ”异方差“ 的。如下图
关于处理的方法:
例子:我们来看一个直观的例子
1.构造一组数据
x = Table[i, {i, 1, 1000}]; y = Table[2*i + RandomInteger[PoissonDistribution[Ceiling[i/100.0]]], {i, 1,1000}];
2.对数据拟合
data = Transpose[{x, y}]; Clear[x]; lm = LinearModelFit[data, x, x]
3.画出残差
cancha = lm["FitResiduals"]; p1 = ListPlot[cancha]
4.按类别,看一下彩色的图
temp = {}; For[i = 1, i <= 10, i++, temp = AppendTo[temp, cancha[[100*i - 99 ;; 100*i]]] ]; dataList = Transpose[{Range @@ #[[1]], #[[2]]}] & /@ Transpose@{# + {1, 0} & /@ Partition[Accumulate[Length /@ Prepend[temp, {}]], 2, 1], temp}; p4 = ListPlot[dataList]
可以看到残差随着x的增大而增大。
5.求出加权的系数
计算总的残差
canchaTotal = Total[Abs[cancha]]/Length[cancha]
计算每一组的残差
canchazu = Table[0, {i, 1, 10}]; For[i = 1, i <= 10, i++, canchazu[[i]] = Total[Abs[cancha[[100*i - 99 ;; 100*i]]]]/99 ]
计算系数
xishu = canchazu/canchaTotal
计算权重
weight = Table[xishu, {i, 1, 100}]; weight = Flatten@Transpose[weight];
6.对加权后的重新拟合
lmn = LinearModelFit[data/weight, x, x]
查看其残差
temp = {}; For[i = 1, i <= 10, i++, temp = AppendTo[temp, canchan[[100*i - 99 ;; 100*i]]] ] dataList = Transpose[{Range @@ #[[1]], #[[2]]}] & /@ Transpose@{# + {1, 0} & /@ Partition[Accumulate[Length /@ Prepend[temp, {}]], 2, 1], temp}; p3 = ListPlot[dataList, ImageSize -> Medium]
可以看到残差比之前要好一点
可以放在一起比较一下
Row[{p4, p3}]
有较为明显的区别。
以上,所有
2016/11/20