『数学记录』概率导论学习笔记(二):随机变量
本文为Dimitri P.Bertsekas与John N. Tsitsiklis所著的《概率导论》的学习笔记。
由于时间紧迫,过于详细的举例说明会导致自己的学习效率较低,于是本文将会比上一篇略去非常多不必要的举例与解释,同时加入很多名词的英文单词,利于以后更好地对外文著作及论文的学习。
Part1 离散随机变量(chapter 2)
本文重点讨论的对象为 随机变量(random variable) ,它对许多概率模型的实验结果数值化起到重要作用。从数学上简要解释的话,就是 随机变量是实验结果的实值函数 。在这一部分,我们所讨论的随机变量是 离散(discrete) 的,即讨论取值有限或可数无限的情况。
1.1 概率质量函数及常见离散随机变量
随机变量给每一个值都分配了一个概率,对于离散随机变量我们将这种对应关系称为 分布列/概率质量函数(probability mass function) 。一个随机变量
其中
既然概率质量函数是一个概率律,那么自然它会满足
伯努利随机变量
简单来说, 伯努利(Bernoulli)随机变量 就是“抛硬币出现正面”,只不过正反面朝上的概率不一定相等,而是
显然满足和为
二项随机变量
简单来说, 二项(binomial)随机变量 就是“抛
之前我们已经证明过它满足和为
它的图像有这样的规律:
几何随机变量
简单来说, 几何(Geometric)随机变量 就是“一直抛硬币直到抛出正面所需次数”。它的概率质量函数也十分地显然:
可以证明它的和为
它的概率质量函数图像是这样的(
结合概率质量函数定义式不难发现
泊松随机变量
泊松(Poisson) 可能并不那么的直观,因为它来自于大名鼎鼎的 泊松过程 。它的概率质量函数由下式给出:
同样可以证明它的和为
下面分别是它的两个概率质量函数图像(
(
当
它的一个应用是去估计二项随机变量概率质量函数。在
令
然后
由此推导出的就是泊松随机变量的概率质量函数。从推导过程能够得出,当参数
1.2 离散随机变量的函数、期望、矩、方差
离散随机变量的函数
设
在变换的同时,概率质量函数也会同时发生改变。设
下面是随机变量三个非常重要的数。
期望与矩
对于一个随机变量,我们在许多时候需要一个简洁的方式去了解它的取值特点。由此就引出了 期望(也称期望值、均值)(expectation) 这一概念。一个离散随机变量的期望等于其所有取值对于取值概率的加权平均:
而 矩(moment) 这一概念来自于物理,它的定义基于期望。矩一般用
方差
对于一个随机变量,只是知道它取值的加权平均远远不够。取值的离散程度也是随机变量一个非常重要的指标。想要表示数据的离散程度,取值与期望的差值是必须的,但为了避免在定义式中出现绝对值,于是使用平方来消去,首先定义了 方差(variance)
而更为实用的 标准差(standard deviation)
标准差更实用,是因为方差在实际应用领域中会有量纲不同这一重大缺陷,而标准差的量纲则与随机变量的一致。
计算方差最暴力的方法是先计算出
但是这样计算实在太麻烦了,这里便引出了随机变量函数期望一个更为简便的公式:
这个公式也不难证明:
这个公式一来是可以很方便地计算
这个公式二来自然也适合方差:
这个公式还可以进一步化简:
特别地,当
它的方差将会是:
特别需要注意的是,除了一次函数的情形外一般情况下
接下来我们讨论一些常见随机变量的均值和方差。
离散均匀随机变量
这种函数的分布列是这样的:
它的均值很好计算,显然是
再将
泊松随机变量
泊松随机变量的期望可由下式得到:
想要计算泊松随机变量的方差,一样是要先算出
所以泊松随机变量的方差就是:
可以发现一个十分有趣但感觉没什么用的性质,那就是泊松随机变量的期望和方差都是
伯努利随机变量
对于
二项随机变量
我们知道,二项随机变量相当于
方差的证明还是要先求得
那么方差就很好求了:
其实对于方差也有一种很方便的求法,利用1.5会提到的方差的线性性可以得到二项随机变量的方差同样是伯努利随机变量的
几何随机变量
这部分需要利用1.4节的工具,因此会在1.4节详细证明。
1.3 多个随机变量的联合概率质量函数
以上关于离散随机变量的理论都是可以推广到多个随机变量上的,下面会简易地从概率质量函数与期望简易地推导二元形式,多元的形式均可通过数学归纳法拓展得到。定义两个随机变量的 联合(joint)概率质量函数
联合概率质量函数可以确定任何由
其中计算
为了方便区分,在有联合概率质量函数的场合,我们称
在解决问题时,往往会出现多个随机变量的函数。对于
知道了
公式的推导与单随机变量的函数类似。
同样地,线性函数的期望对于多个变量的函数仍然有很好的性质。对于 **任意的
其中
1.4 条件
随机变量条件概率质量函数
对于满足
由于所有的事件
联立上面的两个式子可以得到:
所以
条件下的概率质量函数相关计算实际上与一般的概率质量函数无区别。如果所有的事件
当然我们还可以进一步引入更多的事件,以单个事件
当然有时候事件会牵扯到其他的随机变量,这个时候就需要对关于随机变量条件概率质量函数作出简洁的定义:
当然通过它来计算概率质量函数也是一样的,只需将前面式子中的事件替换成
由联合概率质量函数的定义也可以得到其与条件概率质量函数之间的关系:
随机变量条件期望
同样地,只是将本来的事件替换为了随机变量,本质还是一样的。这里给出比较重要的 全期望定理 :
这三个等价地形式都可以称为期望定理。现在来验证第一个公式:
其他两个公式的验证是类似的。
在了解了这一点后,我们就可以尝试求解集合随机变量的期望和方差:
这并不是一个特别好算的无穷级数,因此我们需要做出一些简化。考虑到几何随机变量的意义,不难得到这两个式子:
由此就可以用全期望定理:
这样的一个方程显然就非常好处理,我们可以解得:
如法炮制我们可以解
最后可以得到
1.5 独立性
随机变量的独立性
类似于上一节,随机变量的引入只是将事件替换为于随机变量值相关的事件,并无本质区别,这里不做过多说明。对于随机变量之间的独立性,可以用下面的表述:
我们可以通过这一点推出一个进一步的推论:
方差的线性性
与期望类似,方差也具有线性性。但是方差的线性性需要满足一个条件:
由此得证。
参考资料
- 概率导论(第2版·修订版)
- 作图工具:GeoGebra
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· 阿里最新开源QwQ-32B,效果媲美deepseek-r1满血版,部署成本又又又降低了!
· AI编程工具终极对决:字节Trae VS Cursor,谁才是开发者新宠?
· 开源Multi-agent AI智能体框架aevatar.ai,欢迎大家贡献代码
· Manus重磅发布:全球首款通用AI代理技术深度解析与实战指南
· 被坑几百块钱后,我竟然真的恢复了删除的微信聊天记录!