02 随机变量及其分布 | 概率论与数理统计

1. 随机变量

随机变量：设随机变量的样本空间为 $S={e}$.$X=X(e)$是定义在样本空间$S$上的实值单值函数，则称$X=X(e)$为随机变量

2. 离散型随机变量及其分布律

1. 离散型随机变量

离散型随机变量：全部可能得到的值是有限个或者可列的无限多个的随机变量（有理数具有可列性）
分布律：离散型随机变量$X$的分布律为 $P(X=x_k) = p_k,k=1,2,\dots$，也可以用表格表示：

$X$ $x_1$ $x_2$ $\cdots$ $x_n$ $\cdots$

$p_k$ $p_1$ $p_2$ $\cdots$ $p_n$ $\cdots$

\(X\)	\(x_1\)	\(x_2\)	\(\cdots\)	\(x_n\)	\(\cdots\)
\(p_k\)	\(p_1\)	\(p_2\)	\(\cdots\)	\(p_n\)	\(\cdots\)

2. 几种重要的离散型随机变量

（0-1）分布
1. 分布律：$P\{X=k\}=p^k(1-p)^{1-k},k=0,1(0<p<1)$
二项分布
1. 分布律
\[P\{X=k\} = \binom{n}{k}p^k(1-p)^{n-k} \]
1. 含义：对于一次伯努利试验，只有 $A$ 和 $\bar{A}$两种结果。对于该伯努利试验，事件$A$发生一次的概率为$p$，则事件$A$在$n$次伯努利试验中发生$k$次的概率为上述的分布律
2. 记号：$X\sim b(n,p)$
3. 当 $n=1$ 时二项分布就是（0-1）分布
泊松分布
1. 分布律
\[P\{X=k\} = \frac{\lambda^ke^{-\lambda}}{k!},k=0,1,2,\dots \]
1. 记号：$X\sim \pi(\lambda)$
2. 泊松定理：设$\lambda>0$是一个常数，$n$是任意正整数，设$np_n=\lambda$，则对于任意固定的非负整数$k$，有
\[\lim_{n\to\infty}\binom{n}{k}p_n^k(1-p_n)^{n-k} = \frac{\lambda^ke^{-\lambda}}{k!} \]
当$n$很大，$p_n$很小的时候，可以用泊松分布的公式来近似二项分布

3. 随机变量的分布函数

分布函数：设$X$是一个随机变量，$x$是任意常数，函数$F(x)=P\{X\le x\},-\infty < x < \infty$ 称为$X$的 分布函数
分布函数$F(x)$的性质
1. $F(x)$是一个不减的函数
2. $0\le F(x)\le 1$,并且$F(-\infty)=0,F(\infty)=1$
3. $F(x+0) = F(x)$,即分布函数必须是 右连续 的
离散型随机变量的分布函数：阶梯型函数，在$X=x_k(k=1,2,\dots)$处有跳跃，其跳跃值为$p_k=P\{X=x_k\}$

4. 连续型随机变量及其概率密度

1. 连续型随机变量

连续型随机变量：如果对于随机变量$X$的分布函数$F(x)$，存在非负可积函数$f(x)$，对于任意的实数$x$有$F(x) = \int_{-\infty}^{x}f(t)dt$，则称$X$为连续型随机变量
概率密度函数：$f(x)$称为$x$的概率密度函数，简称概率密度
概率密度函数的性质
1. 非负性：$f(x)\ge 0$
2. 完备性：$\int_{-\infty}^{\infty}f(x)dx = 1$
3. 对于任意的实数$x_1,x_2(x_1\le x_2)$，有
  
  \[P(x_1<X\le x_2) = F(x_2)-F(x_1)=\int_{x_1}^{x_2}f(x)dx \]
4. 若$f(x)$在$x$点处连续，则$F^{'}(x) = f(x)$
注意事项
1. 连续性随机变量的分布函数要求连续，而对于一般的分布函数要求的是右连续即可
2. 对于连续型随机变量，在某一个点上的概率为 0，即$P(a) = 0$，但是这不代表 $x=a$ 是不可能事件
3. 对于连续型随机变量，$P(a,b) = P[a,b] = P(a,b] = P[a,b)$

2. 连续型随机变量的分布

均匀分布
1. 若对于连续型随机变量$X$具有如下概率密度，则称$X$在区间$(a,b)$上服从 均匀分布，记为$X\sim U(a,b)$
  \[f(x)=\left\{\begin{matrix} \frac{1}{b - a},& a<x<b \\ 0,& otherwise \end{matrix}\right. \]
2. 分布函数
  \[F(x) = \left\{\begin{matrix} 0,&x<a\\ \frac{x-a}{b-a},&a\le x<b\\ 1,&x\ge b \end{matrix}\right. \]
3. $f(x)$以及$F(x)$的函数图像
指数分布
1. 若对于连续型随机变量$X$具有如下概率密度，则称 $X$ 是服从 $\theta(\theta >0)$ 的 指数分布
  \[f(x)=\left\{\begin{matrix} \frac{1}{\theta}e^{-\frac{x}{\theta}},& x>0 \\ 0,& otherwise \end{matrix}\right. \]
2. 分布函数
  \[F(x)=\left\{\begin{matrix} 1 - e^{-\frac{x}{\theta}},& x > 0 \\ 0,& otherwise \end{matrix}\right. \]
3. 性质：无记忆性：即$P(X>s+t\mid X>s)=P(X>t)$
4. $f(x)$以及$F(x)$的函数图像
正态分布
1. 若对于连续型随机变量$X$具有如下概率密度，则称$X$服从$\mu,\sigma$的正态分布或者高斯分布，记为$X\sim N(\mu,\sigma^2)$
  
  \[f(x) = \frac{1}{\sqrt{2\pi}\sigma}e^{-\frac{(x-\mu)^2}{2\sigma^2}},\qquad-\infty<x<\infty \]
2. 分布函数
  
  \[F(x) = \frac{1}{\sqrt{2\pi}\sigma}\int_{-\infty}^{x}e^{-\frac{(t-\mu)^2}{2\sigma^2}}dt \]
3. 性质
  1. 曲线关于$x = \mu$对称，且$\forall h>0, P(\mu-h<X\le \mu) = P(\mu < X \le \mu + h)$
  2. 当$x=\mu$时，取到最大值$f_{max}(x)=f(\mu)=\frac{1}{\sqrt{2\pi}\sigma}$
  3. 在$x=\mu \pm \sigma$处有拐点，且曲线以$Ox$轴为渐近线
  4. 如果固定$\sigma$，那么改变$\mu$的值图形就会左右平移
  5. 如果固定$\mu$，当$\sigma$越小的时候，图形越尖；$\sigma$越大图形越扁
4. 标准正态分布：$\mu=0,\sigma=1$
  1. 概率密度：$\varphi(x)=\frac{1}{\sqrt{2\pi}}e^{-\frac{x^2}{2}}$
  2. 分布函数：$\varPhi(x)=\frac{1}{\sqrt{2\pi}}\int_{-\infty}^xe^{-\frac{t^2}{2}}dt$
  3. 性质：$\varPhi(-x) = 1-\varPhi(x)$
  4. 转换：如果随机变量$X\sim N(\mu,\sigma^2)$，则$Z=\frac{X-\mu}{\sigma}\sim N(0,1)$
5. $3\sigma$法则：尽管正态变量的取值范围是$(-\infty,\infty)$，但是它落在$(\mu-3\sigma,\mu+3\sigma)$的概率是$99.74\%$，几乎是肯定的事情
6. $\alpha$分位：假设$X\sim N(0,1)$，那么如果 $z_\alpha$ 满足$P(X>z_\alpha)=\alpha,0<\alpha<1$，那么$z_\alpha$为标准正态分布的上$\alpha$分位数
  - 由$\varphi(x)$的对称性可知：$z_{1-\alpha}=-z_\alpha$

5. 随机变量的函数的分布

1. 离散型随机变量

对于离散型随机变量$X$，如果有$Y=g(X)$，那么 $Y$的分布律就是$X$在函数$g$的作用产生的值再对应相等求和即可

2. 连续型随机变量

标准求法：对于连续型随机变量，需要由随机变量$X$的概率密度去求随机变量 $Y=g(X)$ 的概率密度;解决这类问题的一般方法是：
1. 求出$Y$的分布函数的表达式
$$
F_Y(y)=P(Y\le y)=P(g(X)\le y)=P(X\in C_y),C_y={x|g(x)\le y}
$$
2. 利用连续型随机变量分布函数与概率密度的关系，求导数即可得到所求概率密度
定理：设随机变量$X$具有概率密度 $f_X(x)$ , 又设函数$g(x)$处处可导且有 $g^{'}(x)>0$(或恒有$g^{'}(x)<0$) , 则$Y=g(X)$是连续型随机变量,其概率密度如下，其中$\alpha=min(g(-\infty),g(\infty)),\beta=max(g(-\infty),g(\infty))$，其中$h(y)$是$g(x)$的反函数

\[f_Y(y)=\left\{\begin{matrix} f_X[h(y)]|h^{'}(y)|,& \alpha<y<\beta \\ 0,& otherwise \end{matrix}\right. \]

注意事项
1. 若$g(x)$不是单调函数不能用此定理
2. 若$f(x)$在有限区间$[a, b]$以外等于零，则只需假设在$[a,b]$上恒有$g^{'}(x)>0$(或恒有 $g^{'}(x)<0$) , 此时$\alpha=min\{ g(a), g(b)\}, \beta=max\{g(a), g(b)\}$
补充定理：若$g(x)$在不相叠的区间上逐段严格单调且处处可导，其反函数分别为$h_1(y),h_2(y),\dots$且均为连续函数，那么$Y = g(X)$是连续型随机变量，其概率密度为
$$
f_Y(y)=f_X(h_1(y))|h_1(y)|+f_X(h_2(y))|h_2(y)|+\dots
$$

__EOF__

本文作者：RadiumGalaxy
本文链接：https://www.cnblogs.com/RadiumGalaxy/p/16818154.html
关于博主：评论和私信会在第一时间回复。或者直接私信我。
版权声明：本博客所有文章除特别声明外，均采用 BY-NC-SA 许可协议。转载请注明出处！
声援博主：如果您觉得文章对您有帮助，可以点击文章右下角【推荐】一下。您的鼓励是博主的最大动力！