Chapter 1: 随机事件及其概率
1. 随机试验,样本点,样本空间
若试验具有下列特点:
- 在相同条件下可重复进行
- 每次试验的可能结果不止一个,且所有可能结果在实验前是已知的
- 实验前不能确定哪一个结果会发生
则称该试验为随机试验,常记为 E .
随机试验的每一个可能的结果称为样本点,常用 $\omega$ 表示.
样本点的全体组成的集合称为样本空间,常用$\Omega$表示.
注:样本空间,样本点即中学所学的集合和集合里的点;只不过在概率论学科里,我们习惯称为样本空间和样本点。下面的随机事件,随机事件的运算和关系即子集合,集合的运算和关系。
2. 随机事件
样本空间$\Omega$的子集称为随机事件,简称事件,常用英文大写字母$A,B,\dots$表示.
样本空间只含一个样本点的子集构成的事件称为基本事件;所有样本点组成的全集构成的事件称为必然事件;样本空间的空子集构成的事件称为不可能事件,记为$\emptyset$.
每次随机试验中,当且仅当随机事件$A$所含样本点中的某一个出现时,称为事件$A$发生.
3. 事件的关系与运算
3.1 事件的包含与相等关系
若事件$A$发生必然导致事件$B$发生,则称事件$B$包含事件$A$,或称$A$是$B$的子事件,记为$A\subset B$或$B\subset A$.
若$A\subset B$且$B\subset A$,则称事件$A$与$B$相等,记为$A = B$.
3.2 事件的和,积,差的运算
注:等同于集合的和,积,差的运算
事件的和, 积运算之间的运算规律:
(1) 交换律: $A\cup B = B\cup A$; $A \cap B = B\cap A$.
(2) 结合律: $A\cup (B\cup C) = (A\cup B) \cup C$; $A\cap (B \cap C) = (A \cap B) \cap C$.
(3) 分配律: $A\cup (B \cap C) = (A \cup B) \cap (A \cup C)$; $A\cap (B\cup C) = (A \cap B) \cup (A\cap C)$.
3.3 互不相容事件,或相斥事件
若事件$A$,$B$不能同时发生,即$AB=A\cap B=\emptyset$,则称事件$A$与$B$是互不相容事件.
3.4 对立事件
记$\bar{A}=\Omega-A$,称$\bar{A}$为$A$的对立事件(或补事件,逆事件).
对立事件的运算性质
(4) 对偶律: $\bar{A\cup B} = \bar{A} \cap \bar{B}$; $\bar{A\cap B} = \bar{A} \cup \bar{B}$;
任意$n$个事件的对偶律:
\( \overline{\cup_{i=1}^{n}A_{i}} = \cap_{i=1}^{n}\bar{A_{i}} \);
\( \overline{\cap_{i=1}^{n}A_{i}} = \cup_{i=1}^{n}\bar{A_{i}} \).
4. 概率的定义
4.1 古典概型的概率定义
样本点个数有限且每个样本点发生的可能性相同的试验称为古典试验。
对于古典试验,事件的概率定义如下:
设古典试验的样本空间$\Omega$包含$n$个样本点,事件$A$包含$k$个样本点,则比值$\frac{k}{n}$称为事件$A$的概率,即
$$P(A)=\frac{k}{n}.$$
4.2 几何概型的概率定义
设某试验的样本空间$\Omega$ 含有无限个样本点,每个样本点的发生具有相同的可能性,且$\Omega$ 可以用可以度量的区域或区间$G$表示,事情$A$可以用$G$中的可度量的子集$g$表示,则定义事件$A$的概率为
$$P(A)=\frac{g的度量}{G的度量}.$$
称按上式计算事件概率的数学模型为几何概型,也称上式为概率的几何定义,简称几何概率。
4.3 频率与概率
- 频率
设在相同的条件下,重复进行试验$E$,事件$A$ 在$n$次试验中发生$n_{A}$次,则称比值$n_{A}/n$为事件$A$在这$n$次试验中发生的频率,记为$f_{n}(A)$, 即
$$f_{n}(A)=\frac{n_{A}}{n},$$
其中$n_{A}$称为$A$发生的频数.
- 概率
如果当试验次数$n$很大时,事件$A$的频率$f_{n}(A)$稳定地在某一常数数值$p$的附近摆动,则随机事件$A$的概率等于$p$。称上述定义为事件$A$的统计定义,简称统计概率.
当$n$充分大时,可用频率$f_{n}(A)$作为事件$A$的概率的近似值,即$P(A)\approx f_{n}(A)=\frac{n_{A}}{n}.$
注: 概率的统计定义提供了计算概率的近似方法。
4.4 概率的公理化定义
设随机试验$E$的样本空间为$\Omega$, 对$\Omega$上的任一随机事件$A$,赋予一非负数$P(A)$ , 且$P(A)$满足以下三点:
- (非负性)$P(A)\ge 0$, 其中 $A$ 是$\Omega$上的任一随机事件.
- (规范性)$P(\Omega) = 1$.
- (完全可加性)对一列两两互不相容随机事件$A_1, A_2, ... , A_k, ...$,有 $$ P(\cup_{i=1}^{\infty} A_i) = \sum_{i=1}^{\infty} A_i $$.
则称$P(A)$是随机事件$A$的概率。
注1: 上述定义称为概率的公理化定义 。
注2: 概率是满足上述三条公理的样本空间到实数区间$[0,1]$上的映射,即它是随机事件的函数,类似于对区间的长度度量,平面区域的面积度量.
5. 概率的性质
由定义概率的三条公理及随机事件的关系和运算,可以得到概率的很多性质.
5.1 不可能事件的概率为零,即$P(A)=0$;
5.2 有限可加性:若事件$A_1, ... , A_n$两两不相容,则$$ P(\cup_{k=1}^{n} A_k) = \sum_{k=1}^{n} P(A_k); $$
5.3 对立事件的概率:$P(\bar{A}) = 1 - P(A)$;
5.4 减法公式: $P(B-A) = P(B) - P(AB)$; 若 $A\subset B$, 则$P(B-A) = P(B) - P(A)$;
5.5 加法公式:$P(A\cup B) = P(A) + P(B) - P(AB)$; 对于$n$个事件$A_1, ... , A_n$有
$$P(\cup_{k=1}^{n}A_k)= \sum_{k=1}^{n}P(A_k) - \sum_{1\leq i < j \leq n}P(A_iA_j) + \sum_{1\leq i < j <k \leq n} P(A_i A_j A_k) - ... + (-1)^{n-1}P(A_1 ... A_n). $$
称之为容斥原理.
5.6 单调性:若$B\subset A$, 则 $P(B)\leq P(A)$;
5.7 推论:$P(A\cup B) = 1- P(\overline{A\cup B}) = 1-P(\bar{A}\bar{B})$.
6. 条件概率
设$E$为随机试验,$\Omega$为其样本空间,$A$,$B$为任意两个随机事件,且$P(A)>0$, 则称$$P(B|A)=\frac{P(AB)}{P(B)}$$为事件$A$发生的条件下事件$B$的条件概率.
注1: 条件概率中要求作为条件的事件$A$有正概率,即我们不以$0$概率事件作为讨论问题的前提。
7. 乘法公式
若 $P(A)>0$, $P(B)>0$, 则 $$P(AB) = P(A)P(B|A) = P(B)P(A|B)$$.
注1: 事件$A$, $B$同时发生 = 事件$A$先发生,$B$后发生 = 事件$B$先发生,$A$后发生.
注2:(推广)设 $A_1, A_2, ... , A_n$ 为任意$n$个事件,且 $P(A_1A_2...A_{n-1})>0$, 则
$$P(A_1A_2...A_n) = P(A_1) P(A_2|A_1)P(A_3|A_1A_2)...P(A_n|A_1A_2...A_{n-1}) $$.
8. 全概率公式
设 $B_1,B_2,...,B_n$为样本空间$\Omega$的一个划分,且 $P(B_i)>0, i=1,2,...,n,$ 则对任意事件A有
$$P(A) = \sum_{i=1}^{n}P(B_i)P(A|B_i) $$.
9. 贝叶斯公式
设 $B_1, B_2, ... , B_n$ 为样本空间$\Omega$的一个划分, $A$为$\Omega$中的事件,且$P(A)>0, P(B_i)>0, i = 1, 2, ... , n$, 则
$$P(B_i | A) = \frac{P(B_i)P(A|B_i)}{\sum_{j=1}^{n}P(A | B_j)P(B_j)}.$$
注: $P(B_i)$ 称为先验概率;$P(B_i|A)$是“事件$A$发生的条件下事件$B_i$发生的概率", 称为后验概率;$P(A|B_i)$称为原因概率.
10. 事件的独立性
10.1 两个事件的独立性
若两个事件$A$, $B$满足$$ P(AB) = P(A)P(B), $$
则称事件$A$, $B$独立.
注1: (两事件独立的理解) 上面的等式$P(AB) = P(A)P(B)$本质上就是$P(A) = P(A|B)$, 反映了事件$A$发生与否和事件$B$的发生与否无关. 因为上面的等式$P(AB) = P(A)P(B)$不受$P(B)$是否为0的制约,所以比用$P(A)=P(A|B)$更好.
注2: 在实际问题中,我们并不常用独立性的定义去判断两事件是否独立,而是相反:从事件的实际角度去分析判断其不应有关联,因而是独立,然后应用式子$P(AB)=P(A)P(B)$ (事件独立性简化了乘法公式,从而给计算事件的交的概率带来方便). 例如, 两个工人分别在两台机床上进行生产,彼此各不相干,则各自是否生产出废品或多少废品这类事件应是独立的. 一个人的收入与其姓氏笔画,这类事凭常识推想,认定为独立的.
10.2 多个事件的独立性
设 $A_1, A_2, ...$ 为有限或无限个事件. 如果从其中任意取出有限个$A_{i_1}, A_{i_2}, ... , A_{i_m}$, 都成立
$$ P(A_{i_1}A_{i_2}... A_{i_m}) = P(A_{i_1})P(A_{i_2})...P(A_{i_m}),$$
则称事件$A_1, A_2, ... , $ 相互独立, 或简称独立.
11. 伯努利概型
同一种试验,在相同的试验条件下,重复进行若干次,每次试验的可能结果为有限个. 且每一次的结果都不会受到其他任意一次试验结果的影响,即每次试验结果相互独立,称这样的一系列试验为独立试验序列。
若独立试验序列每次试验的可能结果只有两个,则称之为n重伯努利概型,其中n为试验重复次数.