中学阶段的概率的概念,无法满足后续学习的要求,因此必须从测度论角度重新定义概率。本文整理了一些相关概念。

1 概率的公理化定义

定义 概率空间(probability space):三元参数组\((\Omega, \mathcal{F}, \mathbf{P})\)定义了一个概率空间。

其中\(\Omega\)是样本空间,即一个随机试验的所有可能结果,\(\mathcal{F}\)是样本空间\(\Omega\)的子集的集合,称为\(\sigma\)-域(\(\sigma\)-field),\(\mathbf{P}\)是概率函数。

定义 \(\sigma\)-field:样本空间\(\Omega\)的子集的集合\(\mathcal{F}\)要成为\(\sigma\)-field,必须要满足:

  • \(\Omega\in\mathcal{F}\);
  • \(\text{E}\in\mathcal{F}\),则\(\text{E}^c\in\mathcal{F}\)
  • \(\text{E}_1,\text{E}_2,\cdots\in\mathcal{F}\),则\(\cup_{i=1}^{\infty}\text{E}_i\in\mathcal{F}\)

其中\(\text{E}\)是样本空间\(\Omega\)的某个子集,又叫事件。

定义 概率:定义在\(\mathcal{F}\)上的实函数\(\mathbf{P}\)被称为概率或概率测度,它必须满足

  • 对于一切\(\text{E}\in\mathcal{F}\)都有\(\mathbf{P}(\text{E})\geq 0\);
  • \(\mathbf{P}(\Omega)=1\)
  • \(\text{E}_1,\text{E}_2,\cdots\in\mathcal{F}\)两两互斥,即对于任意\(i\neq j\)都有\(\text{E}_1\cap \text{E}_2=\emptyset\),则\(\mathbf{P}(\cup_{i=1}^{\infty}\text{E}_i)=\sum_{i=1}^{\infty}\mathbf{P}(\text{E}_i)\)

以上这三条性质,也叫概率公理(axioms of probability)。在现代概率论中,所谓概率就是满足这三条公理的函数。

2 随机变量的定义

对于随机试验来说,与其对概率空间上的原始概率结构进行分析,不如先对概率结构进行归纳,归纳成随机变量,再对随机变量进行分析。

定义 随机变量:随机变量\(X\),是样本空间\(\Omega\)到实轴\(\mathbb{R}\)的一个可测函数。

\(X\)是可测度的,即对任意\(A\in\mathcal{B}(\mathbb{R})\),都有\(X^{-1}(A)=\{\omega\in\Omega:X(\omega)\in A\}\in\mathcal{F}\)

接下来定义随机变量的分布。

定义 分布:随机变量\(X\)的分布\(\text{P}_X\)\(X\)\((\mathbb{R},\mathcal{B}(\mathbb{R}))\)上诱导(induced)生成的概率测度,用公式表达为,对于任意\(A\in \mathcal{B}(\mathbb{R})\),都有

\[\text{P}_X(A)=\mathbf{P}(X^{-1}(A))=\mathbf{P}(\omega|X(\omega)\in A) \]

因此,\(\text{P}_X=\mathbf{P}\circ X^{-1}\)在没有歧义的时候,\(\text{P}_X\)可以简写为\(\text{P}\)。很容易可以证明,\(\text{P}\)也是一个概率测度。

定义 累积分布函数\(X\)的累积分布函数(cdf)\(\text{F}_X\)定义为

\[\text{F}_X=\text{P}_X(X\leq x) \]

其中\(x\in \mathbb{R}\)

\(X\)推广为多维随机向量时,就是表示从样本空间\(\Omega\)\(\mathbb{R}^n\)的函数。