指数族和广义线性模型推导
指数族和广义线性模型推导
线性回归和逻辑回归
在推导指数族相关内容前,先关注最普通的线性回归和逻辑回归。
之前我们默认了损失函数定义为平方误差,即如下损失函数(
其计算结果(预测值)是
而逻辑回归,我们默认采用 Sigmoid 函数
逻辑回归的预测值是
接下来通过对指数族以及广义线性模型的分析,指出线性回归和逻辑回归都是其中的特例。
指数族以及经典分布
指数族是一类随机分布,其概率密度为
伯努利分布
随机变量
接下来整理形式说明伯努利分布属于指数族:
我们可以取:
其中
高斯分布
随机变量
取
泊松分布
随机变量
取
指数族的性质
不加证明地指出:
- 期望
; - 方差
。
广义线性模型
根据预测值的类型,我们可以选择分布:
- 如果是 01 分类,则采用伯努利分布;
- 如果是连续实数,则采用高斯分布(实际上大多数情况都可以用高斯分布近似处理,尽管无法证明其遵从高斯分布);
- 如果是正整数,如事件发生次数,则采用泊松分布。
广义线性模型的方法是:无论确定何种指数族分布,总是预测
而我们的预测值是分布的期望
回顾线性回归
线性回归针对连续实数,因此关注高斯分布。直接取对数似然函数(将一些与
最大化上式则需最小化平方误差。也即,平方误差的本质是最大对数似然。
同时,高斯分布的均值为
回顾逻辑回归
现在我们知道逻辑回归实际上是在做伯努利分布的最大似然估计。那么为什么采用 sigmoid 函数为预测值?按照广义线性回归,返回值为期望,即
而根据刚才的推导
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· TypeScript + Deepseek 打造卜卦网站:技术与玄学的结合
· Manus的开源复刻OpenManus初探
· AI 智能体引爆开源社区「GitHub 热点速览」
· C#/.NET/.NET Core技术前沿周刊 | 第 29 期(2025年3.1-3.9)
· 从HTTP原因短语缺失研究HTTP/2和HTTP/3的设计差异
2021-02-22 「SOL」屠龙勇士(LOJ)
2021-02-22 「SOL」礼物(BZOJ)