概率与期望学习笔记(copy)
概率 & 期望
样本空间、随机事件
定义
一个随机现象中可能发生的不能再细分的结果被称为 样本点。所有样本点的集合称为 样本空间,通常用 来表示。
一个 随机事件 是样本空间 的子集,它由若干样本点构成,用大写字母 表示。
对于一个随机现象的结果 和一个随机事件 ,我们称事件 发生了 当且仅当 。
例如,掷一次骰子得到的点数是一个随机现象,其样本空间可以表示为 。设随机事件 为「获得的点数大于 」,则 。若某次掷骰子得到的点数 ,由于 ,故事件 没有发生。
事件的运算
由于我们将随机事件定义为了样本空间 的子集,故我们可以将集合的运算(如和、差、交、并、补等)移植到随机事件上。记号与集合运算保持一致。
特别的,事件的并 也可记作 ,事件的交 也可记作 ,此时也可分别称作 和事件 和 积事件。
因为事件在一定程度上是以集合的含义定义的,因此可以把事件当作集合来对待。
和事件 :相当于 并集 。若干个事件中只要其中之一发生,就算发生了它们的和事件。
积事件 :相当于 交集 。若干个事件必须全部发生,才算发生了它们的积事件。
概率
定义
古典定义
在概率论早期实践中,由于涉及到的随机现象都比较简单,具体表现为样本空间 是有限集,且直观上所有样本点是等可能出现的,因此人们便总结出了下述定义:
如果一个随机现象满足:
- 只有有限个基本结果;
- 每个基本结果出现的可能性是一样的;
那么对于每个事件 ,定义它的概率为
其中 表示对随机事件(一个集合)大小的度量。
统计定义
如果在一定条件下,进行了 次试验,事件 发生了 次,如果随着 逐渐增大,频率 逐渐稳定在某一数值 附近,那么数值 称为事件 在该条件下发生的概率,记做 。
公理化定义
概率函数 是一个从事件域 到闭区间 的映射,且满足:
- 规范性:事件 的概率值为 ,即 。
- 可数可加性:若一列事件 两两不交,则 。
概率函数的性质
对于任意随机事件 ,有
- 单调性:若 ,则有 。
- 容斥原理:。
- ,这里 表示差集。
条件概率
定义
若已知事件 发生,在此条件下事件 发生的概率称为 条件概率,记作 。
在概率空间 中,若事件 满足 ,则条件概率 定义为
可以验证根据上式定义出的 是 上的概率函数。
根据条件概率的定义可以直接推出下面两个等式:
- 概率乘法公式:在概率空间 中,若 ,则对任意事件 都有
- 全概率公式:在概率空间 中,若一组事件 两两不交且和为 ,则对任意事件 都有
Bayes 公式
一般来说,设可能导致事件 发生的原因为 ,则在 和 已知时可以通过全概率公式计算事件 发生的概率。但在很多情况下,我们需要根据「事件 发生」这一结果反推其各个原因事件的发生概率。于是有
上式即 Bayes 公式。
事件的独立性
在研究条件概率的过程中,可能会出现 的情况。从直观上讲就是事件 是否发生并不会告诉我们关于事件 的任何信息,即事件 与事件 「无关」。于是我们就有了下面的定义
定义
若同一概率空间中的事件 , 满足
则称 , 独立。对于多个事件 ,我们称其独立,当且仅当对任意一组事件 都有
直观地说,我们认为两个东西独立,当它们在某种意义上互不影响。例如,一个人出生的年月日和他的性别,这两件事是独立的;但一个人出生的年月日和他现在的头发总量,这两件事就不是独立的,因为一个人往往年纪越大头发越少。数学中的独立性与这种直观理解大体相似,但不尽相同。
多个事件的独立性
对于多个事件,一般不能从两两独立推出这些事件独立。考虑以下反例:
有一个正四面体骰子,其中三面被分别涂成红色、绿色、蓝色,另一面则三色皆有。现在扔一次该骰子,令事件 ,, 分别表示与桌面接触的一面包含红色、绿色、蓝色。
不难计算 ,而 。
显然 ,, 两两独立,但由于 ,故 不独立。
随机事件的独立性
我们称两个事件 , 独立,当 。
我们称若干个事件 互相独立,当对于其中的任何一个子集,该子集中的事件同时发生的概率,等于其中每个事件发生的概率的乘积。形式化地说:
由此可见,若干事件 两两独立 和 互相独立 是不同的概念。
随机变量的独立性
一下用 表示随机变量 的取值范围。即,如果把 看做一个映射,则 看做它的值域。
我们称两个随机变量 独立,当 , ,即 取任意一组值得概率,等于 和 分别取对应值得概率的乘积。
我们称若干个随机变量 互相独立,当 取任意一组值得概率,等于每个 分别取对应值的概率的乘积。形式化地说:
由此可见,若干随机变量 两两独立 和 互相独立 是不同的概念。
概率的计算
-
广义加法公式:对于任意两个事件 有 。
-
条件概率:记 表示在 事件发生的前提下, 事件发生的概率。则 ,其中 为事件 和事件 同时发生的概率。
-
乘法公式:。
-
全概率公式:若事件 构成一组完备的事件且都有正概率,即 且 , 则有 。
-
贝叶斯定理:
随机变量
直观地说,一个随机变量,是一个取值由随机事件决定的变量。
如果基于概率的公理化定义,那么一个随机变量。形式化地说——是一个从样本空间 到实数集 (或者 的某个子集)的映射 。如果 ,你可以直观理解为:当随机实验 取结果 时,该随机变量取值 。
由此可以看到,“随机变量 取值 ”(简记为 )也对应着一个能实现该命题的单位事件集合,因此它也是一个事件,于是也有与之对应的概率 。
期望
引入
想象一下这样一个场景:狗狗 Emissary 想找 tsqtsqtsq 打 slay,但是 tsqtsqtsq 今天想搞卷,于是他想出了这样个办法:
- 如果狗狗 Emissary 在今天的 中获得大于 300 pts,tsqtsqtsq 就会陪它打三小时。
- 如果狗狗 Emissary 在今天的 中获得大于 200 pts,tsqtsqtsq 就会陪它打两小时。
- 如果狗狗 Emissary 在今天的 中获得大于 100 pts,tsqtsqtsq 就会陪它打一小时。
- 如果狗狗 Emissary 在今天的 中获得大于 0 pts,tsqtsqtsq 就会陪它打半小时。
因为狗狗 Emissary 很强,所以它不会保龄。
试求 tsqtsqtsq 陪狗狗 Emissary 打 slay 的期望时长。
我们首先根据条件列出下面这张表格:
分数 | 时长 | 概率 |
---|---|---|
小时 | ||
小时 | ||
小时 | ||
小时 |
令狗狗 Emissary 在今天的 中获得大于 300 pts为事件 。以此类推,其余三种事件分别为 ,,,不难求出期望时长为:
所以 tsqtsqtsq 陪狗狗 Emissary 打 slay 的期望时长为 小时,即 分钟。
大数定律表明,随着重复次数接近无穷大,数值的算术平均值几乎肯定地收敛于期望值,即令第 次 后 tsqtsqtsq 陪狗狗 Emissary 打 slay 的时长为 ,总共有 次 ,则有:
所以在打了不知道多少场 之后 tsqtsqtsq 陪狗狗 Emissary 打 slay 的时长肯定会趋近于这个期望时长。
定义
如果一个随机变量的取值个数有限(比如一个表示骰子示数的随机变量),或可能的取值可以一一列举出来(比如取值范围为全体正整数),则它称为 离散型随机变量 。
形式化地说,一个随机变量被称为离散型随机变量,当它的值域大小 有限 或者为 可列无穷大 。
一个离散性随机变量 的 数学期望 是其每个取值乘以该取值对应概率的总和,记为 。
其中 表示随机变量 的值域, 表示 所在概率空间的样本集合。
性质
- 全期望公式: ,其中 是随机变量, 是在 条件成立下 的期望(即“条件期望”)。可由全概率公式证明。
- 期望的线性性 :对于任意两个随机变量 , (不要求相互独立),有 。利用这个性质,可以将一个变量拆分成若干个互相独立的变量,分别求这些变量的期望值,最后相加得到所求变量的值。
- 乘积的期望 : 当两个随机变量 , 相互独立时,有 。
期望与概率的转化
对于随机事件 ,考虑其示性函数 :
根据定义可以求得其期望 。这一转化在实际应用中非常常见。
条件分布与条件期望
我们之前研究过条件概率,类似的也可以提出所谓条件期望的概念。
定义
对于两个随机变量 ,,在已知 的条件下 的概率分布(密度函数)称之为 条件概率分布(条件概率密度),分别记作
在此条件下, 的期望称为 条件期望,记作 。
条件期望的性质
条件期望的诸多性质可由条件概率推知,在此不做赘述。
值得一提的是 一般是随机变量 的函数,且这个函数通常不是线性的。但实际上有
上式称作 全期望公式。
常用的套路以及技巧
当 时:
前缀和技巧
对于离散变量, 。
例 1
有 个随机变量 ,每个随机变量都是从 中随机一个整数,求 的期望。
例 2
概率为 的事件期望 次之后发生。
拿球问题
例 1
箱子里有 个球 ,你要从里面拿 次球,拿了后不放回,求取出的数字之和的期望。
解:
例 2
箱子里有 个球 ,你要从里面拿 次球,拿了后放回,求取出的数字之和的期望。
解
放不放回概率是一样的,所以:
例 3
箱子里有 个球 ,你要从里边拿 次球,拿了之后有 的概率放回,求取出的球上数字和的期望。
解:
从拿了第一个球和第二个球来看,如果题目中没有要求有概率放回,如果是典例 的那种情况,第一次取得时候每一个球被取中的概率为 ,第二次取得时候每个球被取中的概率为 。
如果加上限制,分别看两种情况。
看拿了第一个球之后,放回的概率就是 ,这个时候再拿第二个球每个球被取中的概率为 。
我们把不放回的概率设为 ,如果不放回,取到每一个球的概率就是 ,前后乘起来就是:。
两种情况算期望的时候为 ,会发现合并起来就是 ,和上边的一样,所以选 次的概率,选中 的概率还是 。
游走问题
例 1
在一条 个点的链上游走,求从一端走到另一端的概率。
解:
用 表示 走到 期望走多少步。
例 2
在一个 个点的完全图上游走,求期望走多少步才能走到另一个点。
解:
每个点到其他点的概率都是 ,所以期望就是 次成功。
例 3
在一张 个点的完全二分图上游走,求从一个点走到另一个点的概率。
解:
左边等价,右边等价。
- 两点在同侧:。
- 两点在异侧:。
例 4
在一张 个点的菊花图上游走,求一个点走到另一个点的概率。
解:
- A.根到叶:。
- B.叶到根:。
- C.叶到叶:。
例 5
在一棵 个点的树上游走,求从根节点走到 的期望步数。
解:
表示从 i 点游走,走到 的期望步数, 为 的入度。
经典问题
例 1
每次随机取一个 的整数,问期望多少次能够凑齐所有的数。
解: 考虑每次取得时候取中以前没取过的数的概率,显然是 。
上边那个东西也等于 ,期望就是 。
例 2
随机一个长度为 的排列 ,求 中的最大值为 的概率。
解:
。
每个前缀中,最大值都有 个位置可以选,所以是 。
例 3
随机一个长度为 的排列 ,求 在 后边的概率。
解:
,挺显然的。
例 4
随机一个长度为 的排列 ,求它包含 为子序列 / 子串的概率。
- 子序列,,把他想想象成很多方块,每个方块都能放一个数,因为是子序列,就从里边选 个块,放这个子序列,剩下的可以随便放,挺显然的。
- 子串,,考虑剩下的 个数都放好了,有 种方案,然后从 个空中任选一个插入长度为 的子串,就是上边那个式子。
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· 阿里最新开源QwQ-32B,效果媲美deepseek-r1满血版,部署成本又又又降低了!
· 单线程的Redis速度为什么快?
· SQL Server 2025 AI相关能力初探
· AI编程工具终极对决:字节Trae VS Cursor,谁才是开发者新宠?
· 展开说说关于C#中ORM框架的用法!