中学阶段的概率的概念,无法满足后续学习的要求,因此必须从测度论角度重新定义概率。本文整理了一些相关概念。
1 概率的公理化定义
定义 概率空间(probability space):三元参数组\((\Omega, \mathcal{F}, \mathbf{P})\)定义了一个概率空间。
其中\(\Omega\)是样本空间,即一个随机试验的所有可能结果,\(\mathcal{F}\)是样本空间\(\Omega\)的子集的集合,称为\(\sigma\)-域(\(\sigma\)-field),\(\mathbf{P}\)是概率函数。
定义 \(\sigma\)-field:样本空间\(\Omega\)的子集的集合\(\mathcal{F}\)要成为\(\sigma\)-field,必须要满足:
- \(\Omega\in\mathcal{F}\);
- 若\(\text{E}\in\mathcal{F}\),则\(\text{E}^c\in\mathcal{F}\);
- 若\(\text{E}_1,\text{E}_2,\cdots\in\mathcal{F}\),则\(\cup_{i=1}^{\infty}\text{E}_i\in\mathcal{F}\)。
其中\(\text{E}\)是样本空间\(\Omega\)的某个子集,又叫事件。
定义 概率:定义在\(\mathcal{F}\)上的实函数\(\mathbf{P}\)被称为概率或概率测度,它必须满足
- 对于一切\(\text{E}\in\mathcal{F}\)都有\(\mathbf{P}(\text{E})\geq 0\);
- \(\mathbf{P}(\Omega)=1\);
- 若\(\text{E}_1,\text{E}_2,\cdots\in\mathcal{F}\)两两互斥,即对于任意\(i\neq j\)都有\(\text{E}_1\cap \text{E}_2=\emptyset\),则\(\mathbf{P}(\cup_{i=1}^{\infty}\text{E}_i)=\sum_{i=1}^{\infty}\mathbf{P}(\text{E}_i)\)。
以上这三条性质,也叫概率公理(axioms of probability)。在现代概率论中,所谓概率就是满足这三条公理的函数。
2 随机变量的定义
对于随机试验来说,与其对概率空间上的原始概率结构进行分析,不如先对概率结构进行归纳,归纳成随机变量,再对随机变量进行分析。
定义 随机变量:随机变量\(X\),是样本空间\(\Omega\)到实轴\(\mathbb{R}\)的一个可测函数。
\(X\)是可测度的,即对任意\(A\in\mathcal{B}(\mathbb{R})\),都有\(X^{-1}(A)=\{\omega\in\Omega:X(\omega)\in A\}\in\mathcal{F}\)。
接下来定义随机变量的分布。
定义 分布:随机变量\(X\)的分布\(\text{P}_X\)是\(X\)在\((\mathbb{R},\mathcal{B}(\mathbb{R}))\)上诱导(induced)生成的概率测度,用公式表达为,对于任意\(A\in \mathcal{B}(\mathbb{R})\),都有
因此,\(\text{P}_X=\mathbf{P}\circ X^{-1}\)在没有歧义的时候,\(\text{P}_X\)可以简写为\(\text{P}\)。很容易可以证明,\(\text{P}\)也是一个概率测度。
定义 累积分布函数:\(X\)的累积分布函数(cdf)\(\text{F}_X\)定义为
其中\(x\in \mathbb{R}\)。
当\(X\)推广为多维随机向量时,就是表示从样本空间\(\Omega\)到\(\mathbb{R}^n\)的函数。