概率论——常用分布

伯努利试验

  伯努利试验(Bernoulli experiment)是在同样的条件下重复地、相互独立地进行的一种随机试验,其特点是该随机试验只有两种可能结果:发生或者不发生

  我们假设该项试验独立重复地进行了 $n$ 次,那么就称这一系列重复独立的随机试验为 $n$ 重伯努利试验,或称为伯努利概型。单个伯努利试验是没有多大意义的,然而,当我们反复进行伯努利试验,去观察这些试验有多少是成功的,多少是失败的,事情就变得有意义了,这些累计记录包含了很多潜在的非常有用的信息。

  如果无穷随机变量序列  $X_{1}, X_{2}, \ldots$  是独立同分布 $(i. i.  d . )$ 的,而且每个随机变量  $X_{i}$  都服从参数为  $\mathrm{p}$  的伯努利分布, 那么 随机变量  $X_{1}, X_{2}, \ldots$  就形成参数为  $p$  的一系列伯努利试验。同样,如果 $n$ 个随机变量  $X_{1}, X_{2}, \ldots, X_{n}$  独立同分布,并且都服从参数为 $p$ 的伯努利分布,则随机变量  $X_{1}, X_{2}, \ldots, X_{n}$  形成参数为  $p$  的 $n$ 重伯努利试验。

  下面举几个例子加以说明,假定重复抛掷一枚均匀硬币,如果在第 $i$ 次抛掷中出现正面,令 $X_{i}=1$ ;如果出现反面$X_{i}=0$,那么,随机变量  $X_{1}, X_{2}, \ldots$  就形成参数为  $p=\frac{1}{2}$  的一系列伯努利试验,同样,假定由一个特定机器生产的零件中  $10 \%$  是有缺陷的,随机抽取 $n$ 个进行观测,如果第 1 个零件有缺陷,令  $X_{i}=1$ ;  如果没有缺陷,令  $X_{i}=0, i=1,2, \ldots, n$ , 那么,随机变量  $X_{1}, X_{2}, \ldots, X_{n} $ 就形成参数为  $p=\frac{1}{10}$  的 $n$ 重伯努利试验。


离散分布

二项分布

  定义:在 $n$ 次独立重复的伯努利试验中,设每次试验中事件 $A$ 发生的概率为 $p$。用 $X$ 表示 $n$ 重伯努利试验中事件 $A$ 发生的次数,则 $X$ 的可能取值为 $0,1,…,n$ ,且对每一个 $k$($0≤k≤n$),事件 ${X=k}$ 即为 “ $n$ 次试验中事件 $A$ 恰好发生 $k$ 次”,随机变量 $X$ 的离散概率分布即为二项分布(Binomial Distribution)。

  记  $X$  为  $n$  重伯努利试验中成功的事件 (记为  $A$  ) 的次数,则  $X=0,1,2, \cdots, n$ 。 $X$  服从二项分布,记  $p$  为事件  $A$  发生的概率, $X$  的分布列为:

    $P\{X=k\}=\left(\begin{array}{l}n \\k\end{array}\right) p^{k}(1-p)^{n-k}, \quad k=0,1, \cdots, n$

  记做

    $X \sim b(n, p)$

    或:$X \sim B(n, p)$

   符号“~”读作“服从于”,该记号表示随机变量 $X$ 服从参数为 $n,p$ 的二项分布。

    

  数学期望:$np$
  方差:$np(1-p)$

  举例:

  1. 设射手命中率为 $0.8$ ,则射击 $n$ 次, 命中的次数 $X \sim b(n, 0.8)$ .
  2. 已知人群中色盲率为 $p$ , 在人群中随机调查50个人,则其中色盲患者 $ X \sim b(50, p)$ .
  3. 某药品的有效率为 $ 0.9$ , 今有 $10$ 人服用,则服药有效的人数 $ X \sim b(10,0.9)$ .
  4.......


两点分布

  两点分布:是一种当 $n=1$ 时的特殊的二项分布,又名 $0-1$分布,伯努利分布,用来描述一次伯努利试验中成功的次数 $X $,其中$X=0,1$ 。$X$ 服从两点分布, 分布列为:

    $P(X=x)=p^{x}(1-p)^{1-x}, \quad x=0,1 $

  或表示为:

     $\begin{array}{c|c|c}\mathrm{X} & 0 & 1 \\\hline P & 1-p & p\end{array}$

  其中 $p=P(X=1)$ 为事件成功的概率。
  举例:
  1. 小明投篮命中率为 $ 0.8$ ,投篮一次,其命中的次数 $ X \sim b(1,0.8)$ ;
  2. 彩票中奖率为 $ 0.0001$ , 小明购买一张彩票, 其中奖的次数 $ X \sim b(1,0.0001) $;
  3. 不会做的单项选择题做对的概率为 $ 0.25$ ,随机选择一个选项, 做对的次数 $ X \sim b(1,0.25) $;
  4. $ \ldots \ldots $
  两点分布是特殊的二项分布, 在二项分布数学期望和方差的公式中取 $n=1$ 得到两点分布:

  数学期望: $p$
  方差: $p(1-p)$

  二项分布与两点分布的关系:若有一列独立同分布于 $ b(1, p)$ 的随机变量序列 $ \left\{X_{i}\right\}_{i=1}^{n}$ , 则其和:

    $X_{1}+X_{2}+\cdots+X_{n}=\sum_{i=1}^{n} X_{i} \sim b(n, p)$

  这个结论表明两点分布具有可加性,且对于服从 $ b(n, p)$ 的随机变量 $ X$ , 可看做由 $ n$ 个独立 同分布于 $ b(1, p)$ 的随机变量 $ X_{i}$ 的和。


泊松分布

  Poisson分布,是一种统计与概率学里常见到的离散概率分布,由法国数学家西莫恩·德尼·泊松(Siméon-Denis Poisson)在1838年时发表。

  泊松分布的概率函数为:

    $P(X=k)=\frac{\lambda^{k}}{k !} \mathrm{e}^{-\lambda}, \quad k=0,1,2, \cdots$

  泊松分布的参数 $\lambda$ 是单位时间(或单位面积)内随机事件的平均发生次数。泊松分布适合于描述单位时间内随机事件发生的次数。

  记 $X \sim P(\lambda)$,常与单位时间、单位面积、单位体积上的计数过程相联系。

    

  数学期望: $\lambda$

  方差: $\lambda$


  这里数学期望为 $ \lambda$ 是指 $ X$ 的均值为 $ \lambda$ 。譬如对于应用举例 1,某段时间内,来到某商场的顾客数平均而言是  $\lambda$ 。其他的应用类似。

  举例:

  1. 某时间段内,来到某商场的顾客数;

  2. 单位时间内,某网站的点击量;

  3. 一平方米内玻璃上的气泡数;

  4. $ \ldots \ldots $


均匀分布

  若随机变量 $X$ 的密度函数为:
    $p(x)=\left\{\begin{array}{lc}\frac{1}{b-a}, & a<x<b \\0, & \text { 其他. }\end{array}\right.$

  称 $ X$ 服从区间  $ (a, b)$  上的均匀分布,记作 $ X \sim U(a, b) $,其分布函数:

    $F(x)=\left\{\begin{array}{ll}0, & x<a \\\frac{x-a}{b-a}, & a \leq x<b \\1, & x \geq b\end{array}\right.$

      

  均匀分布又称作平顶分布(因其概率密度为常值函数)。

  数学期望: $\frac{a+b}{2} $
  方差: $ \frac{(b-a)^{2}}{12}$


超几何分布

   有  $N$  件产品,其中有  $M$  件不合格品。若从中不放回地随机抽取  $n$  件,则其中含有的不合格品的件数  $X$  服从超几何分布,分布列为:

     $P(X=k)=\frac{C_{M}^{k} C_{N-M}^{n-k}}{C_{N}^{n}}=\frac{\left(\begin{array}{c}M \\k\end{array}\right)\left(\begin{array}{c}N-M \\n-k\end{array}\right)}{\left(\begin{array}{l}N \\n\end{array}\right)}, \quad k=0,1, \cdots, r$。

  记为 $X \sim h(n, N, M)$。其中 $r=\min \{M, n\}$,且 $M \leqslant N, n \leqslant N$ 。$n, N, M$ 均为正整数。
  举例:从有 10 件不合格品的 100 件产品中随机抽取 5 件,则抽取的产品中不合格品数   $X \sim h(5,100,10)  $。

  数学期望:$n \bullet \frac{M}{N}$

  方差:$D(X)=\frac{n M}{N}\left(1-\frac{M}{N}\right) \frac{N-n}{N-1}$

  超几何分布和二项分布的联系

  (1) 在超几何分布中,当 $N \rightarrow+\infty$ 时, $\frac{M}{N} \rightarrow P$ (二项分布中的 $\mathrm{p}$) 。
  (2) 当 $ N \rightarrow+\infty$ 时,超几何分布的数学期望

    $E X=\frac{n M}{N} \rightarrow n p=E X$

  (3) 当 $ N \rightarrow+\infty$ 时,超几何分布的方差 $ D X=n p(1-p)$ (二项分布的方差) 。
  (4) 当 $ N \rightarrow+\infty$ 时,超几何分布近似为二项分布。


几何分布

  在伯努利试验序列中,记每次试验中事件 $A$ 发生的概率为 $p$,如果 $X$ 为事件 $A$ 首次出现时的试验次数。详细地说,是:前 $k-1$ 次皆失败,第 $k$ 次成功的概率。则 $X=1,2, \cdots$ 。$X$ 服从几何分布,分布列为:
  $P(X=k)=(1-p)^{k-1} p, \quad k=1,2, \cdots $
  记作 $ X \sim G e(p) $ 。
  举例:
  1. 某产品的不合格率为 0.05 , 首次查到不合格品的检查次数 $ X \sim G e(0.05) $
  2. 某射手的命中率为 0.8 , 首次命中的射击次数 $ X \sim G e(0.8) $
  3. 掷一颗骰子,首次出现六点的投郑次数 $ X \sim G e\left(\frac{1}{6}\right) $
  4. .....

  数学期望: $ \frac{1}{p} $
  方差: $ \frac{1-p}{p^{2}} $

  几何分布的无记忆性:

  设 $X \sim G e(p)$ ,对任意正整数 $m, n$ ,有:

    $P(X>m+n \mid X>m)=P(X>n)$

  该性质表明,在前 $m$ 次试验中 $A$ 没有出现的条件下,则在接下去的 $n$ 次试验中 $A$ 仍末出现 的概率只与 $n$ 有关,而与以前的 $m$ 次试验无关,似乎忘记了前 $m$ 次试验结果, 这就是无记忆 性。


负二项分布

   在伯努利试验序列中,记每次试验中事件  $A $ 发生的概率为  $p$  ,如果  $X$  为事件  $A$  第  $r$  次出 现时的试验次数,则  $X$  的可能取值为  $r, r+1, \cdots, r+m, \cdots$ ,  称 $X$ 服从负二项分布巴斯卡分布,其分布列为:

   $P(X=k)=\left(\begin{array}{l}k-1 \\r-1\end{array}\right) p^{r}(1-p)^{k-r}, \quad k=r, r+1, \cdots$

  记作: $X \sim N b(r, p)$ , 当 $r=1$ 时即为几何分布,即几何分布是特殊的负二项分布。从二项分布和负二项分布的定义中看出,二项分布是伯努利试验次数 ($n$) 固定,事件 $A$ 成功的次数 $X$ 在 $0 \sim n$ 中取值;而负二项分布是事件 $A$ 成功的次数 ( $r$ ) 固定,伯努利实验次数 $X$ 在 $r, r+1, \cdots$ 中取值,可见负二项分布的 "负" 字的由来。

数学期望: $\frac{r}{p} $
方差: $ \frac{r(1-p)}{p^{2}}$

  从负二项分布和几何分布的数学期望和方差的关系可知,类比二项分布与两点分布的关系,可以得 到下面的结论:
  若有一列独立同分布于 $ G e(p)$ 的随机变量序列 $ \left\{X_{i}\right\}_{i=1}^{n}$ , 则其和:

    $X_{1}+X_{2}+\cdots+X_{r}=\sum \limits _{i=1}^{r} X_{i} \sim N b(r, p)$

  这并不是说明几何分布具有可加性,因为可加性要求服从该类分布的随机变量的和仍服从该类分布,但是服从几何分布的随机变量的和服从负二项分布,这个概念要特别注意。上述结论只能说明 对于服从 $ Nb(r, p)$ 的随机变量 $ X$ ,可看做由 $ r$ 个独立同分布于 $ G e(p)$ 的随机变量 $ X_{i}$ 的和。


常用连续分布

正态分布

  正态分布(Normal distribution),也称“常态分布”,又名高斯分布(Gaussian distribution),最早由棣莫弗(Abraham de Moivre)在求二项分布的渐近公式中得到。C.F.高斯在研究测量误差时从另一个角度导出了它。P.S.拉普拉斯和高斯研究了它的性质。

  若随机变量 $X$ 的密度函数为:

    $p(x)=\frac{1}{\sqrt{2 \pi} \sigma} \mathrm{e}^{-\frac{(x-\mu)^{2}}{2 \sigma^{2}}}, \quad-\infty<x<\infty$

  则称 $X$ 服从正态分布,称 $X$ 为正态变量。记 $X \sim N\left(\mu, \sigma^{2}\right) $。其中 $\mu$ 为位置参数,用于控制曲线在 $x$ 轴上的位置; $\sigma$ 为尺度参数,用于控制曲线的形状。

  正态曲线呈钟型,两头低,中间高,左右对称因其曲线呈钟形,因此人们又经常称之为钟形曲线。
  分布函数:

    $F(x)=\int_{-\infty}^{x} p(t) \mathrm{d} t=\int_{-\infty}^{x} \frac{1}{\sqrt{2 \pi} \sigma} \mathrm{e}^{-\frac{(t-\mu)^{2}}{2 \sigma^{2}}} \mathrm{~d} t$

      

数学期望:$\mu$

方差: $\sigma^{2} $

  称 $ \mu=0, \sigma^{2}=1$ 时的正态分布为标准正态分布,其密度函数和分布函数分别为:

    $\begin{array}{l}\varphi(x)=\frac{1}{\sqrt{2 \pi}} \mathrm{e}^{-\frac{x^{2}}{2}} \\\Phi(x)=\int_{-\infty}^{x} \varphi(t) \mathrm{d} t=\int_{-\infty}^{x} \frac{1}{\sqrt{2 \pi}} \mathrm{e}^{-\frac{t^{2}}{2}} \mathrm{~d} t\end{array}$

  任何一个正态变量均可以通过标准化转化为标准正态变量,即若 $X \sim N\left(\mu, \sigma^{2}\right) $,则:

    $X^{*}=\frac{X-\mu}{\sigma} \sim N(0,1)$

  其中 $ X^{*}$ 为标准正志变量。

  性质:

  若 $ X \sim N(0,1) $ :     

    $\begin{array}{l}\Phi(-a)=1-\Phi(a) \\P(X>a)=1-\Phi(a) \\P(a<x<b)=\Phi(b)-\Phi(a) \\P(|X|<c)=2 \Phi(c)-1, \quad(c \geq 0)\end{array}$   

  若 $X \sim N\left(\mu, \sigma^{2}\right)$:     

    $\begin{array}{l}P(X \leq c)=\Phi\left(\frac{a-\mu}{\sigma}\right) \\P(a<x \leq b)=\Phi\left(\frac{b-\mu}{\sigma}\right)-\Phi\left(\frac{a-\mu}{\sigma}\right)\end{array}$   

  正态分布的 $ 3 \sigma$ 原则:     

    $\begin{aligned}P(|X-\mu|<k \sigma) &=\Phi(k)-\Phi(-k) \\&=2 \Phi(k)-1 \\&=\left\{\begin{array}{ll}0.6826, & k=1 \\0.9545, & k=2 \\0.9973, & k=3\end{array}\right.\end{aligned}$


均匀分布

  若随机变量 $X$ 的密度函数为:

    $p(x)=\left\{\begin{array}{lc}\frac{1}{b-a}, & a<x<b \\0, & \text { 其他. }\end{array}\right.$

  称 $ X$ 服从区间 $ (a, b) $ 上的均匀分布,记作 $ X \sim U(a, b)$ , 其分布函数:

    $F(x)=\left\{\begin{array}{ll}0, & x<a \\\frac{x-a}{b-a}, & a \leq x<b \\1, & x \geq b\end{array}\right.$

    

  均匀分布又称作平顶分布(因其概率密度为常值函数)。

  数学期望: $\frac{a+b}{2} $
  方差:$\frac{(b-a)^{2}}{12}$


指数分布

  若随机变量 $X$ 的密度函数为:

    $p(x)=\left\{\begin{array}{cc}\lambda \mathrm{e}^{-\lambda x}, & x \geq 0 \\0, & x<0\end{array}\right.$

  则称 $ X$ 服从参数为 $ \lambda$ 的指数分布,记作 $ X \sim \operatorname{Exp}(\lambda) $ 。指数分布的分布函数为:

    $F(x)=\left\{\begin{array}{cl}1-\mathrm{e}^{\lambda x}, & x \geq 0 \\0, & x<0\end{array}\right.$

    

  指数分布是一种偏态分布,指数分布随机变量只可能取非负实数。指数分布常被用作各种“寿命”分布,譬如电子元器件的寿命、动物的寿命、电话的通话时间、随机服务系统中的服务时间等都可假定服从指数分布。指数分布在可靠性与排队论中有着广泛的应用.。

  数学期望: $\frac{1}{\lambda} $
  方差: $ \frac{1}{\lambda^{2}}$


  指数分布的无记忆性
  若随机变量 $ X \sim \operatorname{Exp}(\lambda)$ , 则对任意的 $ t>0, s>0$ , 有:
    $P(X>s+t \mid X>s)=P(X>t) $
  证明:
  因为 $ X \sim \operatorname{Exp}(\lambda)$ , 所以 $ P(X \geq s)=\mathrm{e}^{-\lambda s},(s>0) $。又因为
    $\{X>s+t\} \subseteq\{X>s\} $
  由条件概率可得:

    $P(X>s+t \mid X>s)=\frac{P(X>s+t)}{P(X>s)}=\frac{\mathrm{e}^{-\lambda(s+t)}}{\mathrm{e}^{-\lambda t}}=\mathrm{e}^{-\lambda t}=P(X>t)$

  证毕。


伽玛分布

  若随机变量 $X$ 的密度函数为:

    $p(x)=\left\{\begin{array}{cl}\frac{\lambda^{a}}{\Gamma(\alpha)} x^{a-1} \mathrm{e}^{-\lambda x}, & x \geqslant 0 \\0, & x<0\end{array}\right.$

  称 $ \mathrm{X}$ 服从伽玛分布, 记作 $ X \sim G a(\alpha, \lambda)$ 。其中 $ \alpha>0$ 为形状参数,$ \lambda>0$ 为尺度参数。

    

  数学期望: $\frac{\alpha}{\lambda} $

  方差: $\frac{\alpha}{\lambda^{2}} $
  伽玛函数的特例:
  1. $\alpha=1$ 时的伽玛分布为指数分布: $G a(1, \lambda)=\operatorname{Exp}(\lambda)$ ,
  2.称 $\alpha=\frac{n}{2}$, $\lambda=\frac{1}{2}$ 的伽玛分布为自由度为 $n$ 的 $\chi^{2}$ (卡方) 分布,记作 $\chi^{2}(n)$ :

    $G a\left(\frac{n}{2}, \frac{1}{2}\right)=\chi^{2}(n)$

  因卡方分布是特殊的伽玛分布,故不难求得卡方分布的:

  数学期望: $ n $  

  方差: $ 2 n$

  卡方分布的唯一参数 $n$ 称为它的自由度, 具体含义在之后的数理统计中会给出。


贝塔分布

  先给出贝塔函数:

    $\mathrm{B}(a, b)=\int_{0}^{1} x^{a-1}(1-x)^{b-1} d x$
  其中参数 $a>0, b>0$ 。

    

  贝塔函数具有以下性质:
  1. $B(a, b)=B(b, a) $
  2.贝塔函数与伽玛函数有如下关系:
    $\mathrm{B}(a, b)=\frac{\Gamma(a) \Gamma(b)}{\Gamma(a+b)}$
  贝塔分布:
  若随机变量 $X$ 的密度函数为:

    $p(x)=\left\{\begin{array}{cc}\frac{\Gamma(a) \Gamma(b)}{\Gamma(a+b)} x^{a-1}(1-x)^{b-1}, & 0<x<1 \\0, & \text { 其他. }\end{array}\right.$

  则称 $ X$  服从贝塔分布, 记作 $X \sim B e(a, b)$ , 其中 $a>0, b>0$  都是形状奈数。

数学期望: $\frac{a(a+1)}{(a+b)(a+b+1)} $
方差: $ \frac{a b}{(a+b)^{2}(a+b+1)}$


参考

1 常用分布

 

 

 

posted @ 2021-10-11 14:05  图神经网络  阅读(2505)  评论(0编辑  收藏  举报
Live2D