[概率论与数理统计]笔记:2.3 常用的离散型分布
2.3 常用的离散型分布
退化分布
若随机变量\(X\)满足
则称\(X\)服从\(a\)处的退化分布,这种情况下,随机变量退化成了一个确定的常数。
两点分布
定义
若随机变量\(X\)只有两个可能取值,设其分布为
则称\(X\)服从\(x_1,x_2\)处参数为\(p\)的两点分布。
如果\(x_1=1,x_2=0\),则称为0-1分布或伯努利分布,也称\(X\)为伯努利随机变量。
性质
当\(x_1=1,x_2=0\)时,有\(EX=p,\quad DX=p(1-p)=pq\),其中\(q=1-p\).
两点分布也可以表示为:\(P\{X=k\}=p^k(1-p)^{1-k},\quad k=0,1\)
两点分布是二项分布的特例
联系
伯努利试验
图像
n个点上的均匀分布
定义
如果随机变量\(X\)的分布满足
则称\(X\)服从\(n\)个点\(\{x_1,x_2,\cdots,x_n\}\)上的均匀分布。
性质
\(EX=\frac{1}{n}\sum\limits_{i=1}^nx_i=\overline{x}\)
\(DX=\frac{1}{n}\sum\limits_{n-1}^n(x_i-\overline{x})^2\)
数学期望的本质是加权平均数,权重就是对应的概率,在均匀分布中,每个权重都是相等的,所以数学期望就等于算术平均数。
联系
古典概型
图像
二项分布
定义
事件\(A\)发生的概率为\(p\),\(n\)次试验,发生了\(k\)次。
如果\(X\)的分布满足
则称\(X\)服从参数为\(n,p\)的二项分布,并记作\(X\sim B(n,p)\).
记\(B(k;n,p)=C_n^kp^k(1-p)^{n-k}\).
当\(n=1\)时,二项分布\(B(1,p)\)就是参数为\(p\)的0-1分布。
性质
- 最可能值
- 若\((n+1)p\)不为整数,则\([(n+1)p]\)达最大值,其中\(f(x)=[x]\)是取整函数。
- 若\((n+1)p\)为正数,则$(n+1)p,\ \ (n+1)p-1 $是最大值。
- 数学期望:\(EX=np\)
- 方差:\(DX=npq\)
联系
\(n\)重伯努利试验
图像
几何分布
定义
\(P(A)=p\),第\(k\)次首次发生,前\(k-1\)次不发生的概率为
这样的分布就叫几何分布,记为\(X\sim G(p)\).
之所以称为“几何”是因为\(q^{k-1}p\)是一个几何数列(也叫等比数列)。
性质
- 数学期望:\(EX=\frac{1}{p}\)
- 方差:\(DX=\frac{q}{p^2}\)
- 无记忆性:\(P\{X>m+n|X>m\}=P\{X>n\}\)
对于无记忆性的理解:就算之前做过了\(m\)次试验,对于接下来的\(n\)次试验是没有影响的。
计算
- \(P\{X=k\}=q^{k-1}p\)
- \(P\{X>m\}=\sum\limits_{k=m+1}^\infty q^{k-1}p\)
图像
超几何分布
定义
\(N\)个元素分为两类,个数分别为\(N_1,N_2\),即\(N=N_1+N_2\)。从\(N\)个元素中取出\(n\)个元素,设随机变量\(X\)为\(n\)个元素中属于第一类元素的个数,则
该分布称为超几何分布,记作\(X\sim H(N,n,N_1)\),(也有\(X\sim H(N,N_1,n)\)的记法)。
有时候会把\(N_1,N_2\)记作\(M,N-M\).
\(X\sim H(N,n,M)\)或\(X\sim H(N,M,n)\)
联系
- 超几何分布是不放回的抽取,二项分布是放回的抽取。
- 当\(N,N_1,N_2\)很大时,可以用二项分布作为超几何分布的近似:
当\(N\to\infty,N_1\to\infty,N_2\to\infty\),且\(\frac{N_1}{N}\to p,\ \frac{N_2}{N}\to q\),对于任意给定的\(n\)和\(k\),有
理解:当\(N_1\)和\(N_2\)都很大时,从中拿走一个不放回,数量几乎不变,相当于放回。
性质
- 数学期望:\(EX=n\cdot\frac{N_1}{N}\)
- 方差:\(DX=n\cdot\frac{N_1}{N}\cdot\frac{N_2}{N}\cdot\frac{N-n}{N_1}\)
图像
这里的参数分别是\(N=100,\ M=36,\ n=50.\)
泊松分布
定义
如果一个随机变量\(X\)的概率分布为
其中\(\lambda>0\)为参数,则称\(X\)服从参数为\(\lambda\)的泊松分布,记作\(X\sim P(\lambda)\).
这里的记号\(P\)是指Poisson。
联系
泊松分布可以用于近似表示二项分布,这是因为当二项分布的\(n\to\infty,\ p\to0,\ np=\lambda\)时,二项分布就成为了泊松分布。
泊松定理:在\(n\)重伯努利试验中,事件\(A\)在每次试验中发生的概率为\(p_n\)(这里的概率与试验总数\(n\)有关),如果\(n\to\infty\)时,\(np\to\lambda\)(\(\lambda>0\)为常数),则对任意给定的\(k\),有
证明过程如下:
前提条件有:\(n\to\infty,\ p\to0,\ np=\lambda\),所以有\(p=\frac{\lambda}{n}\).
需要用到的公式:\(C_n^k=\frac{n!}{k!(n-k)!}\),\(\lim\limits_{x\to\infty}(1+\frac{1}{x})^x=e\).
首先,将\(p=\frac{\lambda}{n}\)和组合数公式代入,则
将\(n!\)和\((n-k)!\)进行化简:
因此,
此时关注分子的\(n(n-1)\cdots(n-k+1)\),以及分母的\(n^k\)(两者都是有\(k\)项相乘):
因此,
此时,再关注\(\lim\limits_{n\to\infty}(1-\frac{\lambda}{n})^{n-k}\),
其中,因为\(n\to\infty\),且\(\lambda,\ k\)都是有限值,所以\((1-\frac{\lambda}{n})\to1\),所以\(\lim\limits_{n\to\infty}(1-\frac{\lambda}{n})^{-k}=1\)
所以\(\lim\limits_{n\to\infty}(1-\frac{\lambda}{n})^{n-k}=\lim\limits_{n\to\infty}(1-\frac{\lambda}{n})^n\)
又因为
因此
证明完毕,
证明思路和下面的案例分析来源于B站视频👉泊松分布是怎么来的?应该怎么用?
性质
- 数学期望:\(EX=\lambda\)
- 方差:\(DX=\lambda\)
案例分析
假设有一停车场,1min进入了3辆车,目标是预测1min进入5辆车的概率。
将1min进行\(n\)等分,且\(n\to\infty\),表示1min做了\(n\)次伯努利试验。
将\(\frac{1}{n}\)时间内进入一辆车的概率记为\(p\),则\(p\to0\)。
此时,\(\lambda=np=3\).
对应的泊松分布为:\(P\{X=k\}=\frac{3^k}{k!}e^{-3}\)
所以1min进入5辆车的概率为:\(P\{X=5\}=\frac{3^5}{5!}e^{-3}\approx0.10081881\)
图像
使用教材:
《概率论与数理统计》第四版 中国人民大学 龙永红 主编 高等教育出版社