Logistic Regression
Logistic Regression
模型介绍
逻辑回归作为一个判别模型,其形式如下:
参数为
与Linear Regression不同,极大化NLL得不到解析解,对上式求导得到梯度和Hessian矩阵
式中
优化方法
对于无约束的凸优化问题
Steepest descent
在二范数下,Steepest descent的下降方向为负梯度方向,即
牛顿方法
牛顿方法是二阶方法,其求解步骤如下
- 设定初始点
以及收敛条件 - 计算
,并与收敛条件进行比较,但尚未收敛时执行以下步骤 - 计算
,根据计算的步长 ,对参数 进行更新
可以看出牛顿方法需要对矩阵进行求逆,因此即使
Iteratively reweighted least square
当使用牛顿法解
式中
- 初始化
- 根据
计算更新 - 迭代至收敛
Quasi-Newton methods
为了避免牛顿方法中的矩阵逆运算,Quasi-Newton methods使用近似的
根据泰勒展开可以得到
在上式中对
令
BFGS方法认为
带入
中得到 假设一种特殊情况
可以解得
,得到 的迭代关系如下 由于
,在求下降方向时经常会使用 ,下面对其进行近似。 对上述关系应用两次Sherman-Morrion公式
得到(这部分推导比较繁琐,参阅zhirom博客)
整体的BFGS算法流程如下
- 初始化
,令 - 确定搜索方向
- 利用exact line search或者backtracting line search确定搜索步长,得到
- 计算
,若不收敛时继续执行 - 利用
得到 ,返回第二步
L-BFGS方法是在BFGS基础上舍弃了对矩阵的保存,仅保留了最近的m个
结果,节约了内存空间。在计算 时使用了two-loop recursion,暂时不清楚这个计算方法的原理,在这里不写出,可参阅星环科技-知乎回答一文。
L2正则
如果给定的数据集是线性可分的,那么
如果在NLL中添加
多类别
当考虑的类别数量多余2时,其形式如下
令
令系数矩阵
得到
假设
贝叶斯角度的逻辑回归
Gaussian approximate
不同于之前的线性回归,很难找到逻辑回归的共轭先验。
式中Z为规整系数的常数项,可以理解为
对
可以得到
当对
上式中忽略了常数项,且默认
Guassion approximate for Logistic Regression
假设
上述的式子和[L2正则](# L2正则)类似。在得到
MAP和Laplace approximateion比较
Approximatting the posterior predictive
在得到参数的后验分布后,对
当然可以采用插值法,比如
Online Learning and stochastic optimization
与离线训练确定参数不同,线上学习是不断应用于新数据、调整参数。
上述的Online gradient descent可以用来对参数进行更新。
stochastic optimization是说在目标函数中有随机变量,如
可以利用online gradient descent 对stochastic optimization进行计算,
在设置学习率
如:
生成方法和判别方法的对比
生成方法和判别方法的根本区别是判别方法通常极大化
- 生成方法计算通常更简单,如朴素贝叶斯,通过参数的加减即可得到参数的分布;
- 判别模型对特征的处理更方便,生成模型通常对特征假设了分布,如果进行特征的变换,则很可能与假设产生矛盾。
Fisher线性判别分析
高斯判别分析时(注意这是一个生成模型)在高维数据时时常会遇到一些问题。一个自然的降维方法是进行低维的线性变换
Fisher linear discriminant analysis假设变换后的低位数据可以用高斯判别分析很好的分离,其是生成模型和判别模型的混合。其最大的缺点为变换后的维度要小于
二分类问题
在二分类情况下,
即两个类别的均值映射之差的平方应该尽量大,每个类别方差应该尽量小。
拓展至多维
待添加
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· 从 HTTP 原因短语缺失研究 HTTP/2 和 HTTP/3 的设计差异
· AI与.NET技术实操系列:向量存储与相似性搜索在 .NET 中的实现
· 基于Microsoft.Extensions.AI核心库实现RAG应用
· Linux系列:如何用heaptrack跟踪.NET程序的非托管内存泄露
· 开发者必知的日志记录最佳实践
· TypeScript + Deepseek 打造卜卦网站:技术与玄学的结合
· Manus的开源复刻OpenManus初探
· AI 智能体引爆开源社区「GitHub 热点速览」
· C#/.NET/.NET Core技术前沿周刊 | 第 29 期(2025年3.1-3.9)
· 从HTTP原因短语缺失研究HTTP/2和HTTP/3的设计差异