拓端tecdat|R语言编程指导中GLM(广义线性模型)，非线性和异方差可视化分析

原文链接：http://tecdat.cn/?p=13839

上周在非人寿保险课程中，我们了解了广义线性模型的理论，强调了两个重要组成部分

链接函数（这实际上是在预测模型的关键）
分布或方差函数

考虑数据集

lin.mod = lm(dist~speed,data=cars)

线性模型

$Y_i=\beta_0+\beta_1 X_i +\varepsilon_i$

假设残差独立且具有相同的方差。如果我们可视化线性回归，会看到：

这里的想法（在GLM中）是假设

$Y\vert X=x\sim\mathcal{N}( \beta_0+\beta_1 x,\sigma^2)$

它将基于某些误差项生成与先前描述的模型相同的模型。该模型可以在下面看到，

C=trans3d(c(x,x),c(y,rev(y)),c(z,z0),mat)
polygon(C,border=NA,col="light blue",density=40)
C=trans3d(x,y,z0,mat)
lines(C,lty=2)
C=trans3d(x,y,z,mat)
lines(C,col="blue")}

这里确实有两部分：平均值的线性增加 $\mathbb{E}(Y\vert X=x)=\beta_0+\beta_1 x$ 和正态分布的恒定方差 $\text{Var}(Y\vert X=x)=\sigma^2$ 。

另一方面，如果我们假设泊松回归，

poisson.reg = glm(dist~speed,data=cars,family=poisson(link="log"))

我们有这样的结果

有两件事同时发生了变化：我们的模型不再是线性的，而是指数的 $\mathbb{E}(Y\vert X=x)=e^{\beta_0+\beta_1 x}$ ，并且方差也随着解释变量的增加而增加 $\text{Var}(Y\vert X=x)=e^{\beta_0+\beta_1 x}$ ，因为有了泊松回归，