【机器学习】广义线性模型 GLM

广义线性模型 GLM

GLM 是什么

GLM 是一种模型,或者说是建模方法,使用 GLM,可以让把现实中的问题转化为机器学习需要的形式,也就是确定自己需要的假设函数 hθ(x),从而推出所需的最优化目标。需要注意的是,GLM只能对那些服从指数分布族的问题建模。

什么是指数分布族 The exponential family

指数分布族是指一类特殊的概率分布,这些分布都可以被写成

p(y;n)=b(y)exp(ηTT(y)a(η))

的形式。

许多常见的分布都属于指数分布族,也就是说,他们可以改写成上面这种形式。

比如,伯努利分布 YBernoulli(ϕ)

p(y;ϕ)=ϕy(1ϕ)1y=exp(ylog(ϕ)+(1y)log(1ϕ))=exp((log(ϕ1ϕ))y+log(1ϕ))

其中,

T(y)=yη=log(ϕ1ϕ)a(η)=log(1ϕ)=log(1+eη)b(y)=1

如何使用 GLM 构建模型

GLM 模型的核心其实就是三个假设:

  1. yx;θExpotentialFamily(η)
  2. 给定 x(也就是特征),我们预测的目标是 T(y) 的期望,通常情况下有 T(y)=y,所以我们的假设函数就是 h(x)=E[yx]
  3. 参数 η 和输入 x 是线性关系:η=θTx

举例

线性回归的推导

如果给定 x 的情况下,YN(μ,σ2)

p(y;μ)=12πexp(12(yμ)2)=12πexp(12y2)exp(μy12μ2)η=μT(y)=ya(η)=μ2/2=η2/2b(y)=(1/2π)exp(y2/2)

所以假设函数为:

hθ(x)=E[yx;θ]=μ=η=θTx

正好是线性回归的假设函数。

逻辑回归的推导

如果给定 x 的情况下,YBernoulli(ϕ)

从上面的推导可得:

η=log(ϕ1ϕ)ϕ=11eη

从而,假设函数为:

hθ(x)=E[yx;θ]=ϕ=1/(1+eη)=1/(1+eθTx)

正好就是 Logistic 回归的形式!

posted @   杨谖之  阅读(745)  评论(0编辑  收藏  举报
相关博文:
阅读排行:
· 震惊!C++程序真的从main开始吗?99%的程序员都答错了
· 【硬核科普】Trae如何「偷看」你的代码?零基础破解AI编程运行原理
· 单元测试从入门到精通
· 上周热点回顾(3.3-3.9)
· winform 绘制太阳,地球,月球 运作规律
点击右上角即可分享
微信分享提示
主题色彩