机器学习——概率论的加和与乘积规则
下面来推导概率论的加和与乘法规则
假设两个随机变量X和Y,随机变量X可以随机取任意的,随机变量Y可以随机取任意的。进行N次试验,对X和Y都进行了取样,把且出现的试验次数记为。并且把X取值为(与Y的取值无关)出现的试验次数记为, 类似地,把Y取值为的试验数量的次数记为。
X取值为且Y取值为的概率记为,被称为和的联合概率(joint probability)。它的计算方法为落在单元格i,j的点的数量与总的点数的比值,即
(1.5)
类似地,X取值的概率被记为,它的计算方法为落在第i列上点数与点的总数的比值,即
(1.6)
Y取的概率记为, 它的计算方法为落在第j行的点数与点的总数的比值,即
由于下面图片中第i列各个方格里面点数之和满足,因此可以可以推导
(1.7)
公式(1.7)就是概率的加和规则。注意,此次单个变量的概率有时被称为边缘概率。如果我们只考虑那些的实例,那么这些实例中的实例所占的比例被写成,被称为给定的的条件概率(conditional probability)。它的计算方式为:计算落在单元格的点的数量与第i列的点的数量的比值,即
(1.8)
根据公式(1.5)(1.6)(1.8),可以推导出下面公式
(1.9)
这个就是概率论的乘法规则。
使用如下简单的记法来表示概率论的两条基本规则:
sum rule (1.10)
product rule (1.11)
这里的是联合概率,可以表述为“X且Y的概率”。类似地,是条件概率,可以表述为“给定X条件下Y的概率”,是边缘概率,可以表述为“X的概率”。这两个简单的规则是概率论的基础。
上面介绍了概率论的两个重要的规则:加和规则和乘法规则。涉及到联合概率、条件概率、边缘概率这些名词和概念。下面基于此引入贝叶斯定理。由于联合概率的定义可知,根据乘法规则,可以推导出
(1.12)
这就是贝叶斯定理,在模式识别和机器学校领域中扮演者中心角色。使用(1.10)(1.11)可以得到,由此可见分母可以用出现在分子中的项来表示。我们可以将分母看出一个归一化的常数,用于确保公式(1.12)左侧的条件概率对于所有的取Y值之和为1
参考
【1】机器学习 周志华
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· 全程不用写代码,我用AI程序员写了一个飞机大战
· DeepSeek 开源周回顾「GitHub 热点速览」
· 记一次.NET内存居高不下排查解决与启示
· MongoDB 8.0这个新功能碉堡了,比商业数据库还牛
· .NET10 - 预览版1新功能体验(一)