（概率论与数理统计-八）几种重要的一维概率分布及其特点

几种重要的一维概率分布及其特点

Content

离散型随机变量

退化分布

伯努利分布

二项分布

泊松分布

几何分布

超几何分布

连续型随机变量

均匀分布

指数分布

高斯分布

退化分布（Degenerate Distribution）

离散型随机变量

亦称”确定性分布“，”凝聚分布“，”单点分布“，就是整个样本空间只有一个随机变量取值，而且它的概率一定为1.

设X表示必然事件c:

$P(X=c) = 1$

伯努利分布（Bernoulli Distribution）

离散型随机变量

亦称“两点分布”，就是整个样本空间只有两种情况，不是其一就是其二.

设X表示再一次Bernoulli试验中某事件发生:

$P(X=1) = p$

$P(X=0)=1-p$

二项分布（Binomial Distribution）

离散型随机变量

本质上就是 "n重Bernoulli distribution"，进行了多次的伯努利试验，而每一次都是相互独立的。

设X表示n重Bernoulli试验中某事件发生的次数，X的可能取值有$0, 1, 2, ..., n$:

$P(X=k) = C_n^kp^k(1-p)^{n-k}$

上述情况称为X服从参数为n，p的伯努利分布，记为

$X$~$B(n, p)$

泊松分布（Poisson Distribution）

离散型随机变量

若X的概率分布律为：

$P(X=k) = \frac{\lambda^ke^{-\lambda}}{k!}，k=0,1,2...$

其中$\lambda＞0$，就称X服从参数为$\lambda$的泊松分布

记为 $X$~$\pi(\lambda)$ 或 $X$~$P(\lambda)$

$P(X=0) + P(X=1) + ... P(X=+∞) = e^{-\lambda}·\sum_{k=0}^{+∞}\frac{\lambda^k}{k!}$，而根据泰勒展开式可得：$e^\lambda = \sum_{k=0}^{+∞}\frac{\lambda^k}{k!}$，所以可知概率之和为1.

Poisson Distribution 的用途：
- 某人一天内收到的微信的数量
- 来到某公共汽车站的乘客
- 某放射性物质发射出的粒子
- 显微镜下某区域中的白血球
如果某事件以固定强度$\lambda$，随机且独立地出现，该时间在单位时间内出现的次数（个数）可以看成是服从泊松分布。
Poisson distribution 与 Binomial distribution 的关系:

当$n＞10, p＜0.1$时，

$C_n^kp^k(1-p)^{n-k} ≈ \frac{e^{-\lambda}\lambda^k}{k!}$，其中 $\lambda = np$

即当n很大，p很小时，$B(n, p) ≈ P(np)$

几何分布（Geometric Distribution）

离散型随机变量

其实就是进行多次Bernoulli试验直到A事件发生为止

设X为进行试验的次数直到A事件发生，A事件发生的概率为 $p$

$P(X=k) = (1-p)^kp，k=1,2,3,...$

那称X服从参数为 $p$ 的几何分布，记为

$X$ ~ $Geom(p)$

举个栗子🌰

假设我们买一种中奖率为1%彩票，每一次中奖的概率都一样，买了k次直到中奖

单独买第k次的中奖概率都比第k-1次要低，但只要次数足够多，买了k次就中奖的概率就是前k次中奖概率的总和，如上图。

超几何分布（Hypergeometric Distribution）

离散型随机变量

待补

均匀分布（Uniform Dsitribution）

连续型随机变量

若 $X$ 的PDF为 $f(x)\begin{cases} \frac{1}{b-a}, x\in(a, b) \\0, otherwise \end{cases}$

就称 $X$ 服从(a, b)上的Uniform distribution

记为 $X$~$U(a, b)$ 或 $X$~$Unif(a, b)$

$X$~$U(a, b)$ 的PDF图

$X$~$U(a, b)$ 的CDF图

$X$~$U(a, b)$的计算
1. $P(x\in I) = \int_If(x)dx$
2. $P(x \in I) = \frac{I \bigcap (a, b) 的长度}{(a, b) 的长度}$

指数分布（Exponential Distribution）

连续型随机变量

若 $X$ 的概率密度函数为 $f(x) = \begin{cases} \lambda e^{-\lambda x} ，x>0\\ 0，x \leq 0\end{cases} (\lambda >0)$

则称 $X$ 服从参数为 $\lambda$ 的Exponential distribution

记为 $X$~$E(\lambda)$ 或 $X$~$Exp(\lambda)$

重要性质：$X$~$E(\lambda)$具有无记忆性

$P(X>a|X>b) = P(X>a-b)$
指数分布用途
1. 可以用来表示独立随机事件发生的时间间隔，比如旅客进机场的时间间隔、中文维基百科新条目出现的时间间隔等；
2. 在排队论中，一个顾客接受服务的时间长短也可以用指数分布来近似；
3. 无记忆性的现象；

高斯分布（Guassian Distribution / Normal Distribution）

连续型随机变量

若 $X$ 的PDF为

$f(x) = \frac{1}{\sqrt{2\pi}\sigma}e^{-\frac{(x-\mu)^2}{2\sigma^2}}, (-\infty < x < \infty)$

就称 $X$ 服从参数为 $\mu, \sigma$ 的高斯分布（或正太分布，或误差分布）

记为 $X$~$N(\mu, \sigma^2)$

两个参数的含义：
- $\sigma$：称为尺度参数，会决定曲线分散程度。当固定 $\mu$ ， $\sigma$ 越小，图形越高越瘦，$\sigma$ 越大，图形越矮越胖。
- $\mu$：称为位置参数，会决定对称轴的位置，当固定 $\sigma$ ，改变 $\mu$ 相当于将图像沿 $x$ 轴平移，图形整体形状不变。
正态分布的概率计算：

若 $X$~$N(\mu, \sigma^2)$，对实数 $x$

$P(X \leq x) = F(x) = \frac{1}{\sqrt{2\pi}\sigma}\int_{-\infty}^xe^{\frac{(t-\mu)^2}{2\sigma^2}dt}$

但积分算不出来，于是我们一般会将其转化为标准正态，然后利用标准正态分布表来求。

于是用到了以下性质：

当$X$_{$N(\mu,\sigma^2)$时，$\frac{X-\mu}{\sigma}$}$N(0,1)$

举个栗子🌰
一批钢材长度(cm) $X$~$N(\mu,\sigma^2)$，$\mu=100$，$\sigma=2$，

求：
1. 这批钢材长度小于97.8的概率；
2. 这批钢材长度落在区间(97.8,103)的概率；
标准正态分布
正态分布的用途：
- 自然界和人类社会中很多现象可以看作正态分布
  - 人的生理尺寸（身高、体重）；
  - 医学检验指标（红细胞数、血小板）；
  - 测量误差；
  - 等等
- 多个随机变量的和可以用正态分布来近似(中心极限定理)
  - 某位同学完成所有作业的时间；
  - 二项分布
  - 等等

posted @ 2018-07-18 14:55 Benjamin142857 阅读(5268) 评论(0) 收藏举报

刷新页面返回顶部

Benjamin142857