【机器学习】广义线性模型 GLM

广义线性模型 GLM

GLM 是什么

GLM 是一种模型，或者说是建模方法，使用 GLM，可以让把现实中的问题转化为机器学习需要的形式，也就是确定自己需要的假设函数 \(h_{\theta}(x)\)，从而推出所需的最优化目标。需要注意的是，GLM只能对那些服从指数分布族的问题建模。

什么是指数分布族 The exponential family

指数分布族是指一类特殊的概率分布，这些分布都可以被写成

\[p(y;n)=b(y)exp(\eta ^TT(y)-a(\eta)) \]

的形式。

许多常见的分布都属于指数分布族，也就是说，他们可以改写成上面这种形式。

比如，伯努利分布 \(Y\sim Bernoulli(\phi)\)：

\[\begin{aligned} p(y;\phi)&=\phi ^y(1-\phi)^{1-y} \\ &=\exp(y\log(\phi)+(1-y)\log(1-\phi))\\ &=\exp\left(\left(\log\left(\frac{\phi}{1-\phi}\right)\right)y+\log(1-\phi)\right) \end{aligned}\]

其中，

\[\begin{aligned} T(y)&=y \\ \eta&=\log \left(\frac{\phi}{1-\phi}\right) \\ a(\eta)&=-\log(1-\phi) \\ &=\log(1+e^\eta) \\ b(y)&=1 \end{aligned}\]

如何使用 GLM 构建模型

GLM 模型的核心其实就是三个假设：

\(y\mid x;\theta\sim \mathrm{ExpotentialFamily}(\eta)\)
给定 \(x\)（也就是特征），我们预测的目标是 \(T(y)\) 的期望，通常情况下有 \(T(y)=y\)，所以我们的假设函数就是 \(h(x)=\mathrm{E}\left[y\mid x\right]\)。
参数 \(\eta\) 和输入 \(x\) 是线性关系：\(\eta = \theta ^T x\)

举例

线性回归的推导

如果给定 \(x\) 的情况下，\(Y\sim\mathcal{N}(\mu,\sigma^2)\)：

\[\begin{aligned} p(y;\mu)&=\frac{1}{\sqrt{2\pi}}\exp\left(-\frac{1}{2}(y-\mu)^2\right) \\ &=\frac{1}{\sqrt{2\pi}}\exp\left(-\frac{1}{2}y^2\right)\cdot\exp\left(\mu y-\frac{1}{2}\mu^2\right) \\ \\ \eta&=\mu \\ T(y)&=y \\ a(\eta)&=\mu^2/2 \\ &=\eta^2/2\\ b(y)&=(1/\sqrt{2\pi})\exp(-y^2/2) \end{aligned}\]

所以假设函数为：

\[\begin{aligned} h_\theta(x)&=E[y\mid x;\theta] \\ &=\mu \\ &=\eta \\ &=\theta^Tx \end{aligned}\]

正好是线性回归的假设函数。

逻辑回归的推导

如果给定 \(x\) 的情况下，\(Y\sim Bernoulli(\phi)\)：

从上面的推导可得：

\[\begin{aligned} \eta&=\log \left(\frac{\phi}{1-\phi}\right) \\ \phi&=\frac{1}{1-e^{-\eta}} \end{aligned}\]

从而，假设函数为：

\[\begin{aligned} h_\theta(x)&=\mathrm{E}\left[y\mid x;\theta\right] \\ &=\phi \\ &=1/(1+e^{-\eta}) \\ &=1/(1+e^{-\theta ^T x}) \end{aligned}\]

正好就是 Logistic 回归的形式！

posted @ 2022-05-21 12:39 杨谖之阅读(525) 评论(0) 编辑收藏举报

会员力量，点亮园子希望

刷新页面返回顶部

Loading

Tiumo's Blog

自我控制是最强者的本能。