常见分布
离散分布
巴斯卡分布
每次成功的概率为 \(p\) ,直到有 \(r\) 次成功需要的实验次数的分布,分布列为
二项分布
\(n\) 次实验,每次成功的概率为 \(p\) ,成功的次数 \(\xi\sim B(n,p)\) 称为服从二项分布,分布列为
- 数学期望:直接通过定义计算较为复杂,可以利用期望的加法性质,设计伯努利实验
则 \(E\xi_i = p\) ,而 \(\xi = \sum_{i=1}^n\xi_i\) ,从而 \(E\xi = np\) .
-
方差:同理于上面的方法,有 \(E(\xi_i-E\xi)^2 = p(1-p)^2 + (1-p)p^2 = p(1-p)\) ,从而 \(Var\xi = np(1-p)\) .
-
特征函数: \(f(t) = (pe^{it}-p+1)^n\) .
泊松分布
\(k\) 取非负整数,参数 \(\lambda > 0\) ,则 \(\xi\sim P(\lambda)\) 称为服从泊松分布,其分布列为
- 数学期望:
-
方差: \(E\xi = \lambda\) .
-
特征函数: \(f(t) = e^{\lambda(e^{it}-1)}\) .
几何分布
每次成功的概率为 \(p\) ,直到成功为止需要的实验次数的分布,分布列为
- 数学期望: \(E\xi = \dfrac{1}{p}\) .
- 方差: \(Var\xi = \dfrac{1-p}{p^2}\) .
- 特征函数: \(f(t) = \dfrac{pe^{it}}{1-(1-p)e^{it}}\) .
超几何分布
\(N\) 件产品, \(M\) 件次品,抽查 \(n\) 件有 \(k\) 件次品的概率,分布列为
超几何分布趋向二项分布.
连续分布
均匀分布
\(\xi\sim U(a,b),\ a<b\) ,服从均匀分布,密度函数为
- 数学期望: \(E\xi = \dfrac{a+b}{2}\) .
- 方差: \(Var\xi = \dfrac{(b-a)^2}{12}\) .
- 特征函数: \(f(t) = \dfrac{e^{itb}-e^{ita}}{i(b-a)t}\) .
特别的,当 \(\xi\sim U(-a,a)\) 时,有 \(f(t) = \dfrac{\sin at}{at}\) .
正态分布
\(\xi\sim N(a,\sigma^2),\ \sigma > 0\) ,服从正态分布,密度函数为
当 \(a=0,\ \sigma = 1\) 时,称为标准正态分布 \(N(0,1)\) ; \(\eta = \frac{\xi-a}{\sigma}\) 称为标准化随机变量,它服从 \(N(0,1)\)
-
标准正态分布: \(\Phi(1) = 0.8413,\ \Phi(2) = 0.97725,\ \Phi(3) = 0.99865\) .
-
数学期望: \(E\xi = a\) .
-
方差: \(Var\xi = \sigma^2\) .
-
特征函数: \(f(t) = e^{iat-\frac{\sigma^2t^2}{2}}\) .
相加性质:若 \(\xi,\ \eta\) 相互独立,且 \(\xi\sim N(a,\sigma_1^2),\ \eta\sim N(b,\sigma_2^2)\) ,则 \(\xi+\eta\sim N(a+b,\sigma_1^2+\sigma_2^2),\ \xi-\eta\sim N(a-b,\sigma_1^2+\sigma_2^2)\) .
二维正态分布
二维正态分布满足
则有
密度函数为
记为 \((\xi,\eta)\sim N(a,b,\sigma_1^2,\sigma_2^2,r)\) .
例 若 \((\xi,\eta)\sim N(a,b,\sigma_1^2,\sigma_2^2,r)\) ,则求 \(\zeta = \xi+\eta\) 的分布.
利用正态分布的性质, \(\xi\sim N(a,\sigma_1^2),\ \eta\sim N(b,\sigma_2^2)\) ,从而 \(\zeta\sim N(a+b,\sigma_1^2+\sigma_2^2)\) .
边际密度就是分离出的两个正态分布
因此二维正态分布的边际分布仍为正态分布.
指数分布
\(\xi\sim E(\lambda)\) ,参数 \(\lambda>0\) ,服从指数分布,密度函数为
- 数学期望: \(\lambda^{-1}\)
- 方差: \(\lambda^{-2}\) .
- 特征函数: \(f(t) = \dfrac{\lambda}{\lambda-it}\) .
习题
- 有 \(12\) 台车床独立工作,每台开车时间占总工作时间的 \(2/3\) ,开车时每台需要 \(1\) 单位电力,则若供给 \(9\) 单位电力,则因电力不足耽误生产的概率.
由题意 \(P(工作) = 2/3\) ,记 \(\xi\) 为工作的台数,则只需考虑
此题的关键在于开车时间占总工作时间的 \(2/3\) 意味着工作的概率为 \(2/3\) .
- 推广的伯努利试验,每次有三种可能 \(A_1,A_2,A_3\) ,概率为 \(p_1,p_2,p_3\) ,进行 \(n\) 次重复独立实验,则求 \(A_1,A_2\) 出现次数的联合分布.
记 \(A_1\) 有 \(\xi\) 次, \(A_2\) 有 \(\eta\) 次,则
为联合分布,边际分布易得.
- 联合分布 \((\xi,\eta)\) 的密度函数为
则可以算出 \(A = 2\) ,计算
这里使用了二重积分的转换.
- 设 \(\xi\sim P(\lambda)\) ,则求 \(\eta = a+b\xi,\ \zeta = \xi^2\) 的分布.
- 利用分布函数求解随机变量函数的密度函数。设 \(\xi\) 有密度函数 \(p(x)\) ,则求分布密度
- \(\eta = 1/\xi,\ P(\xi=0) = 0\)
需要注意 \(\xi\) 和 \(x\) 都有正负号的问题:
当 \(x<0\) ,必有 \(\xi < 0\) ,从而 \([1/x,0]\) 是积分区间;
当 \(x>0\) ,分为 \(\xi<0\) 和 \(\xi > 0\) 两种情况,从而有两端积分区间;
故有密度函数 \(p_{\eta}(x) = F_{\eta}^{\prime}(x) = p(1/x)/x^2,\ x\neq 0\) .
- \(\eta = \tan\xi\)
故有密度函数 \(p_{\eta}(x) = p(\arctan x)/(1+x^2)\) .
- 连续型随机变量函数的变换。若 \(\xi\sim N(a,\sigma^2)\) ,则 \(\eta = e^{\xi}\) 的密度函数.
其中 \(f(x) = e^x\) ,取反函数 \(f^{-1}(y) = \ln y\) ,注意定义域为 \(y>0\) .
- 系统 \(L\) 由 \(L_1,L_2\) 组成,寿命分别为 \(X\sim E(a),Y\sim E(b)\) ,则 \(L\) 的寿命 \(Z\) 的密度函数.
- \(L_1,L_2\) 串联
此时 \(Z = \min\{X,Y\}\) ,有分布函数
故有密度函数 \(p_Z(z) = F_Z^{\prime}(z)\) .
- \(L_1,L_2\) 并联
此时 \(Z = \max\{X,Y\}\) ,有分布函数
故有密度函数 \(p_Z(z) = F_Z^{\prime}(z)\) .
- \(L_1,L_2\) 互为备用
此时 \(Z = X+Y\) ,由卷积公式
这是卷积公式的直接应用.
- 在 \((0,a)\) 线段上随机投掷两点,求两点距离的密度函数.
将点的坐标设为 \(x,y\) ,则有距离的分布函数
求导得到密度函数.
- 设 \((\xi,\eta)\) 服从二元正态分布 \(N(0,0,\sigma_1^2,\sigma_2^2,r)\) ,求 \(\xi+\eta,\ \xi-\eta\) 相互独立的充要条件.
根据线性变换
可以看出 \(\xi+\eta,\ \xi-\eta\) 也服从二元正态分布,因此相互独立的充要条件为
从而有 \(\sigma_1^2 = \sigma_2^2\) .
- 设 \((\xi,\eta,\zeta)\) 有联合密度
求 \(U = \xi+\eta+\zeta\) 的密度函数.
我们令 \(V = \eta,\ W=\zeta\) ,则得到
从而有反函数组
易得 \(|J| = 1\) ,因此有联合密度 \(P_{UVW}(u,v,w) = 6(1+u)^{-4},\ (v>0,w>0,u>v+w)\) ,然后求取边际密度即可.
补 设 \(\xi_1,\xi_2,\xi_3\) 独立同分布,服从参数为 \(1\) 的指数分布,令 \(W_1 = \frac{\xi_1}{\xi_1+\xi_2+\xi_3},\ W_2 = \frac{\xi_1+\xi_2}{\xi_1+\xi_2+\xi_3}\) ,求 \(W_1,W_2\) 的联合分布.
参数不足,可以添加新的参数,取 \(\eta_1 = \xi_1,\ \eta_2=\xi_1+\xi_2,\ \eta_3=\xi_1+\xi_2+\xi_3\) ,容易求出它们的联合分布;添加 \(W_3 = \xi_1+\xi_2+\xi_3\) ,则有反函数组
求出 \(W_1,W_2,W_3\) 的联合分布,然后取边际分布即可,需要注意定义域.