逻辑回归 之 Logist 推导
Logist从概率角度认识
可以咱学校教材大二版的<<概率论与数理统计>> - 山大版, 来整一波, 为了简化推导形式呢, 这里就假设2个样本空间的形式来展开, 基于(条件概率) 全概率与贝叶斯 作为核心.
栗子: 全概率与贝叶斯
举个我们学校概率论教材的栗子, 这里就不展开概念说明, 自行百度吧, 这只想通过栗子直观感受一波.
设某厂有甲, 乙,丙 三个车间都生产 A 产品. 已知(先验概率):
各车间产量分别占全厂的 25%, 35%, 40%,
且各车间的次品率分别为 5%, 4%, 2%.
需求1: 现随机抽取一个样本, 则它是次品的概率有多大?
求解如下:
设A1, A2, A3 分别表示 "产品分别由甲, 乙, 丙 车间生产", B 表示 "产品为次品"
显然 A1, A2, A3 构成完备事件组 (就是一个样本空间), 且可得到:
P(A1) = 25%, P(B|A1) = 5%
P(A2) = 35%, P(B|A2) = 4%
P(A3) = 40%, P(B|A3) = 2%
要求P(B) 的(全) 概率, 其分散于, A, B, C 发生下, B的概率之和,即:
需求2: 现任意取一件, 已知是次品, 求是哪个车间生产的概率最大?
反推哦, 其实就是求 P(A1 |B), P(A2|B), P(A3|B)
因此, B 的发生, 来自 即乙厂的可能最大.
这其中呢, 其实在不知不觉中用到了贝叶斯公式:
设A1,A2,A3..构成完备事件组, 则对任意一事件B有:
分母是 全概率, 分子是 "分量"
logist 函数推导
假设样本空间 s1, s2, 现已知(样本) 事件 x 发生. (但不知道是基于 s1 还是 s2)
请问: 当 X 事件已经发生下, 是基于 是基于 s1 的概率有多大?
即求 P(s1|x)
这就是一个经典的条件概率问题.
先求 P(x) 的全概率:
目标( 根据贝叶斯定理:)
分子, 分母同时 除以 分子得:
令 回代到 (4):
即得出:
对数运算性质:
logistic 函数性质
也可以叫做, sigmoid 函数, 一样的. 画出来的话是一个 "s" 形状的曲线.
- 值域是在 [0, 1] 的连续可导的增函数
- x = 0 处, y = 0
- x , y -> 0
- x y -> 1
刻画概率的累计分布, 如果从概率视角来认识的话.
输入一个 x (可以是标量, 向量), 输出一个 [0,1] 的值 的时候, y=1 的 概率是多少. 这里y一共有两种情况 y = 1或 y=0. 这不就是一个二分类问题吗
结合线性模型:
于是, 这样就很清晰认识到, 逻辑回归, 看着像回归, 线性模型嘛, 其实是二分类.
下篇就整一波如何构造目标函数来求解参数向量
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· 基于Microsoft.Extensions.AI核心库实现RAG应用
· Linux系列:如何用heaptrack跟踪.NET程序的非托管内存泄露
· 开发者必知的日志记录最佳实践
· SQL Server 2025 AI相关能力初探
· Linux系列:如何用 C#调用 C方法造成内存泄露
· 无需6万激活码!GitHub神秘组织3小时极速复刻Manus,手把手教你使用OpenManus搭建本
· Manus爆火,是硬核还是营销?
· 终于写完轮子一部分:tcp代理 了,记录一下
· 别再用vector<bool>了!Google高级工程师:这可能是STL最大的设计失误
· 单元测试从入门到精通