[概率论与数理统计]笔记:2.3 常用的离散型分布

2.3 常用的离散型分布

退化分布

若随机变量\(X\)满足

\[P\{X=a\}=1 \]

则称\(X\)服从\(a\)处的退化分布,这种情况下,随机变量退化成了一个确定的常数。


两点分布

定义

若随机变量\(X\)只有两个可能取值,设其分布为

\[P\{X=x_1\}=p,\quad P\{X=x_2\}=1-p,\quad 0<p<1, \]

则称\(X\)服从\(x_1,x_2\)处参数为\(p\)两点分布

如果\(x_1=1,x_2=0\),则称为0-1分布伯努利分布,也称\(X\)伯努利随机变量

性质

\(x_1=1,x_2=0\)时,有\(EX=p,\quad DX=p(1-p)=pq\),其中\(q=1-p\).

两点分布也可以表示为:\(P\{X=k\}=p^k(1-p)^{1-k},\quad k=0,1\)

两点分布是二项分布的特例

联系

伯努利试验

图像

0-1分布

n个点上的均匀分布

定义

如果随机变量\(X\)的分布满足

\[P\{X=x_i\}=\frac{1}{n},\quad i=1,2,\cdots,n, \]

则称\(X\)服从\(n\)个点\(\{x_1,x_2,\cdots,x_n\}\)上的均匀分布

性质

\(EX=\frac{1}{n}\sum\limits_{i=1}^nx_i=\overline{x}\)

\(DX=\frac{1}{n}\sum\limits_{n-1}^n(x_i-\overline{x})^2\)

数学期望的本质是加权平均数,权重就是对应的概率,在均匀分布中,每个权重都是相等的,所以数学期望就等于算术平均数。

联系

古典概型

图像

n点的均匀分布

二项分布

定义

事件\(A\)发生的概率为\(p\)\(n\)次试验,发生了\(k\)次。

如果\(X\)的分布满足

\[P\{X=k\}=C_n^kp^k(1-p)^{n-k},\quad k=0,1,2,\cdots,n, \]

则称\(X\)服从参数为\(n,p\)二项分布,并记作\(X\sim B(n,p)\).

\(B(k;n,p)=C_n^kp^k(1-p)^{n-k}\).

\(n=1\)时,二项分布\(B(1,p)\)就是参数为\(p\)0-1分布

性质

  • 最可能值
    • \((n+1)p\)不为整数,则\([(n+1)p]\)达最大值,其中\(f(x)=[x]\)是取整函数。
    • \((n+1)p\)为正数,则$(n+1)p,\ \ (n+1)p-1 $是最大值。
  • 数学期望:\(EX=np\)
  • 方差:\(DX=npq\)

联系

\(n\)重伯努利试验

图像

二项分布

几何分布

定义

\(P(A)=p\),第\(k\)次首次发生,前\(k-1\)次不发生的概率为

\[P\{X=k\}=(1-p)^{k-1}p=q^{k-1}p,\quad k\ge1 \]

这样的分布就叫几何分布,记为\(X\sim G(p)\).

之所以称为“几何”是因为\(q^{k-1}p\)是一个几何数列(也叫等比数列)。

性质

  • 数学期望:\(EX=\frac{1}{p}\)
  • 方差:\(DX=\frac{q}{p^2}\)
  • 无记忆性\(P\{X>m+n|X>m\}=P\{X>n\}\)

对于无记忆性的理解:就算之前做过了\(m\)次试验,对于接下来的\(n\)次试验是没有影响的。

计算

  • \(P\{X=k\}=q^{k-1}p\)
  • \(P\{X>m\}=\sum\limits_{k=m+1}^\infty q^{k-1}p\)

图像

几何分布

超几何分布

定义

\(N\)个元素分为两类,个数分别为\(N_1,N_2\),即\(N=N_1+N_2\)。从\(N\)个元素中取出\(n\)个元素,设随机变量\(X\)\(n\)个元素中属于第一类元素的个数,则

\[P\{X=k\}=\frac{C_{N_1}^kC_{N_2}^{n-k}}{C_N^n},\quad k=0,1,2,\cdots.min\{n,N_1\} \]

超几何分布1

该分布称为超几何分布,记作\(X\sim H(N,n,N_1)\),(也有\(X\sim H(N,N_1,n)\)的记法)。

有时候会把\(N_1,N_2\)记作\(M,N-M\).

\(X\sim H(N,n,M)\)\(X\sim H(N,M,n)\)

联系

  • 超几何分布是不放回的抽取,二项分布是放回的抽取。
  • \(N,N_1,N_2\)很大时,可以用二项分布作为超几何分布的近似:

\(N\to\infty,N_1\to\infty,N_2\to\infty\),且\(\frac{N_1}{N}\to p,\ \frac{N_2}{N}\to q\),对于任意给定的\(n\)\(k\),有

\[\lim\limits_{N\to\infty}\frac{C_{N_1}^kC_{N_2}^{n-k}}{C_N^n}=C_n^kp^kq^{n-k} \]

理解:当\(N_1\)\(N_2\)都很大时,从中拿走一个不放回,数量几乎不变,相当于放回。

性质

  • 数学期望:\(EX=n\cdot\frac{N_1}{N}\)
  • 方差:\(DX=n\cdot\frac{N_1}{N}\cdot\frac{N_2}{N}\cdot\frac{N-n}{N_1}\)

图像

超几何分布3

这里的参数分别是\(N=100,\ M=36,\ n=50.\)


泊松分布

定义

如果一个随机变量\(X\)的概率分布为

\[P\{x=K\}=\frac{\lambda^k}{k!}e^{-\lambda},\quad k=0,1,2,\cdots \]

其中\(\lambda>0\)为参数,则称\(X\)服从参数为\(\lambda\)泊松分布,记作\(X\sim P(\lambda)\).

这里的记号\(P\)是指Poisson。

联系

泊松分布可以用于近似表示二项分布,这是因为当二项分布的\(n\to\infty,\ p\to0,\ np=\lambda\)时,二项分布就成为了泊松分布。

泊松定理:在\(n\)重伯努利试验中,事件\(A\)在每次试验中发生的概率为\(p_n\)(这里的概率与试验总数\(n\)有关),如果\(n\to\infty\)时,\(np\to\lambda\)\(\lambda>0\)为常数),则对任意给定的\(k\),有

\[\lim\limits_{n\to\infty}B(k;n,p)=\lim\limits_{n\to\infty}C_n^kp^k(1-p)^{n-k}=\frac{\lambda^k}{k!}e^{-\lambda} \]

证明过程如下

前提条件有:\(n\to\infty,\ p\to0,\ np=\lambda\),所以有\(p=\frac{\lambda}{n}\).

需要用到的公式:\(C_n^k=\frac{n!}{k!(n-k)!}\)\(\lim\limits_{x\to\infty}(1+\frac{1}{x})^x=e\).

首先,将\(p=\frac{\lambda}{n}\)和组合数公式代入,则

\[\lim\limits_{n\to\infty}C_n^kp^k(1-p)^{n-k}=\lim\limits_{n\to\infty}\frac{n!}{k!(n-k)!}(\frac{\lambda}{n})^k(1-\frac{\lambda}{n})^{n-k} \]

\(n!\)\((n-k)!\)进行化简:

\[\frac{n!}{k!(n-k)!}=\frac{n(n-1)\cdots(n-k+1)}{k!} \]

因此,

\[原式=\lim\limits_{n\to\infty}\frac{n(n-1)\cdots(n-k+1)}{k!}\frac{\lambda^k}{n^k}(1-\frac{\lambda}{n})^{n-k} \]

此时关注分子的\(n(n-1)\cdots(n-k+1)\),以及分母的\(n^k\)(两者都是有\(k\)项相乘):

\[\begin{align*} \lim\limits_{n\to\infty}\frac{n(n-1)\cdots(n-k+1)}{n^k} &=\lim\limits_{n\to\infty}\frac{n}{n}\cdot\frac{n-1}{n}\cdots\frac{n-k+1}{n} \\ &=\lim\limits_{n\to\infty}1\times(1-\frac{1}{n})\times\cdots\times(1-\frac{k-1}{n}) \\ &=\lim\limits_{n\to\infty}1\times1\times\cdots\times1 \\ &=1 \end{align*} \]

因此,

\[原式=\lim\limits_{n\to\infty}\frac{\lambda^k}{k!}(1-\frac{\lambda}{n})^{n-k} \]

此时,再关注\(\lim\limits_{n\to\infty}(1-\frac{\lambda}{n})^{n-k}\)

\[\lim\limits_{n\to\infty}(1-\frac{\lambda}{n})^{n-k} = \lim\limits_{n\to\infty}(1-\frac{\lambda}{n})^n(1-\frac{\lambda}{n})^{-k} \]

其中,因为\(n\to\infty\),且\(\lambda,\ k\)都是有限值,所以\((1-\frac{\lambda}{n})\to1\),所以\(\lim\limits_{n\to\infty}(1-\frac{\lambda}{n})^{-k}=1\)

所以\(\lim\limits_{n\to\infty}(1-\frac{\lambda}{n})^{n-k}=\lim\limits_{n\to\infty}(1-\frac{\lambda}{n})^n\)

又因为

\[\begin{align*} \lim\limits_{n\to\infty}(1-\frac{\lambda}{n})^n &= \lim\limits_{n\to\infty}(1+\frac{1}{-\frac{n}{\lambda}})^n\quad\quad //\ \lambda从分子移到分母 \\ &= \lim\limits_{n\to\infty}[(1+\frac{1}{-\frac{n}{\lambda}})^{-\frac{n}{\lambda}}]^{-\lambda}\quad\quad //\ 指数拼凑出与自然对数重要极限一致的形式\\ &= e^{-\lambda} \end{align*} \]

因此

\[\begin{align*} 原式 &= \lim\limits_{n\to\infty}\frac{\lambda^k}{k!}(1-\frac{\lambda}{n})^{n-k}\\ &= \frac{\lambda^k}{k!}\lim\limits_{n\to\infty}(1-\frac{\lambda}{n})^{n-k}\quad\quad//\ 常数提取 \\ &= \frac{\lambda^k}{k!}\lim\limits_{n\to\infty}(1-\frac{\lambda}{n})^n\quad\quad//\ 根据上面的推导 \\ &= \frac{\lambda^k}{k!}e^{-\lambda} \end{align*} \]

证明完毕,

\[\lim\limits_{n\to\infty}C_n^kp^k(1-p)^{n-k}=\frac{\lambda^k}{k!}e^{-\lambda} \]

证明思路和下面的案例分析来源于B站视频👉泊松分布是怎么来的?应该怎么用?

性质

  • 数学期望:\(EX=\lambda\)
  • 方差:\(DX=\lambda\)

案例分析

假设有一停车场,1min进入了3辆车,目标是预测1min进入5辆车的概率。

将1min进行\(n\)等分,且\(n\to\infty\),表示1min做了\(n\)次伯努利试验。

\(\frac{1}{n}\)时间内进入一辆车的概率记为\(p\),则\(p\to0\)

此时,\(\lambda=np=3\).

对应的泊松分布为:\(P\{X=k\}=\frac{3^k}{k!}e^{-3}\)

所以1min进入5辆车的概率为:\(P\{X=5\}=\frac{3^5}{5!}e^{-3}\approx0.10081881\)

图像

泊松分布

使用教材:
《概率论与数理统计》第四版 中国人民大学 龙永红 主编 高等教育出版社

posted @ 2023-01-06 19:06  feixianxing  阅读(705)  评论(0编辑  收藏  举报