逻辑回归(Logistic regression)是分类方法。可以处理二元分类和多元分类。
一、逻辑斯谛分布
逻辑斯谛分布的密度函数 f(x) 和分布函数 F(x) 如图。分布函数属于逻辑斯谛函数,曲线以点 (μ,12) 中心对称。

二、二元逻辑回归模型
二元逻辑回归模型是如下条件概率分布:
P(Y=1|x)=e(θ ∙ x+b)1+e(θ ∙ x+b)(1)
P(Y=0|x)=11+e(θ ∙ x+b)(2)
x∈RnRn (n 维),Y∈{0,1},θ∈RnRn ,θ 称为权值向量,b 称为偏置。
对给定的样本 x,带入式 (1)、(2) 求得两个概率值。比较概率值的大小,将 x 分为概率大的那一类。
为了方便,将 θ 和 x 加以扩充,即 θ=(θ(1),θ(2),...,θ(n),b)T,x=(x(1),x(2),...,x(n),1)T
二元逻辑回归模型如下:
P(Y=1|x)=e(θ ∙ x)1+e(θ ∙ x)(3)
P(Y=0|x)=11+e(θ ∙ x)(4)
一个事件的几率指发生的概率与不发生的概率比值。
事件的对数几率(logit 函数)是:
logit(p)=logp1−p
由式 (3)、(4)得
logP(Y=1|x)1−P(Y=1|x)=θ ∙ x
即输出 Y=1 的对数几率是 由输入 x 的线性函数表示的模型,即逻辑回归模型。
则
P(Y=1|x)=11+e(−θ ∙ x)
三、线性回归到逻辑回归
线性回归模型 y 和 x 之间的线性关系系数 θ,满足 y=θ ∙ x。因为此时 y 是连续的,所以是回归模型。
从线性回归到逻辑回归,需要 y 是离散,对 y 做转换,变为 g(y)。如果 g(y) 结果是两种,就是二元分类模型。
g 一般取 sigmoid 函数:
g(y)=11+e−y
取 sigmoid 函数的原因有两个:
- 当 y 趋于正无穷,g(y) 趋于1,当 y 趋于负无穷,g(y) 趋于0。
- g(y) 容易求导。g′(y)=g(y)(1−g(y))
令 g(y) 中的 y 为:y=θ ∙ x,得到二元逻辑回归的一般形式:
hθ(x)=11+e(−θ ∙ x)
四、二元逻辑回归损失函数
线性回归 Y 是连续的,用均方误差定义损失函数。但逻辑回归不连续,用极大似然估计法求损失函数。
设:
P(Y=1|x)=hθ(x)P(Y=0|x)=1−hθ(x)
两个式子写成一个式子:
P(Y|x)=hθ(x)y(1−hθ(x))(1−y)
似然函数为:
L(θ)=m∏i=1(hθ(x(i)))y(i)(1−hθ(x(i)))1−y(i)
m 为样本个数。
对数似然函数取反即为损失函数:
J(θ)=−lnL(θ)=−m∑i=1(y(i)log(hθ(x(i))+(1−y(i))log(1−hθ(x(i))))=−m∑i=1y(i)log(hθ(x(i))−m∑i=1(1−y(i))log(1−hθ(x(i)))
损失函数矩阵形式:
J(θ)=−YTloghθ(X)−(E−Y)Tlog(E−hθ(X))
其中 E 为全 1 向量。
五、二元逻辑回归损失函数优化
损失函数最小话,常见的有梯度下降法、坐标轴下降法、等牛顿法。
六、二元逻辑回归损失函数正则化
逻辑回归有时也有过拟合问题,需要正则化。
L1 正则化:
J(θ)=−YTloghθ(X)−(E−Y)Tlog(E−hθ(X))+α∥θ∥1
其中 ∥θ∥1为 θ 的 L1 范数。
L1 正则化损失函数优化方法常用:坐标轴下降法、最小角回归法。
L2 正则化:
J(θ)=−YTloghθ(X)−(E−Y)Tlog(E−hθ(X))+12α∥θ∥22
其中 ∥θ∥2为 θ 的 L2 范数。
L1 正则化损失函数优化方法与普通逻辑回归类似。
逻辑回归尤其二元逻辑回归,虽然没支持向量机(SVM)占主流,但训练速度比 SVM 快很多。
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· Linux系列:如何用heaptrack跟踪.NET程序的非托管内存泄露
· 开发者必知的日志记录最佳实践
· SQL Server 2025 AI相关能力初探
· Linux系列:如何用 C#调用 C方法造成内存泄露
· AI与.NET技术实操系列(二):开始使用ML.NET
· 无需6万激活码!GitHub神秘组织3小时极速复刻Manus,手把手教你使用OpenManus搭建本
· C#/.NET/.NET Core优秀项目和框架2025年2月简报
· Manus爆火,是硬核还是营销?
· 终于写完轮子一部分:tcp代理 了,记录一下
· 【杭电多校比赛记录】2025“钉耙编程”中国大学生算法设计春季联赛(1)