02 随机变量及其分布 | 概率论与数理统计

1. 随机变量

  • 随机变量:设随机变量的样本空间为 \(S={e}\).\(X=X(e)\)是定义在样本空间\(S\)上的实值单值函数,则称\(X=X(e)\)为随机变量

2. 离散型随机变量及其分布律

1. 离散型随机变量

  1. 离散型随机变量:全部可能得到的值是有限个或者可列的无限多个的随机变量(有理数具有可列性)

  2. 分布律:离散型随机变量\(X\)的分布律为 \(P(X=x_k) = p_k,k=1,2,\dots\),也可以用表格表示:

    \(X\) \(x_1\) \(x_2\) \(\cdots\) \(x_n\) \(\cdots\)
    \(p_k\) \(p_1\) \(p_2\) \(\cdots\) \(p_n\) \(\cdots\)

2. 几种重要的离散型随机变量

  1. (0-1)分布
    1. 分布律:\(P\{X=k\}=p^k(1-p)^{1-k},k=0,1(0<p<1)\)
  2. 二项分布
    1. 分布律

    \[P\{X=k\} = \binom{n}{k}p^k(1-p)^{n-k} \]

    1. 含义:对于一次伯努利试验,只有 \(A\)\(\bar{A}\)两种结果。对于该伯努利试验,事件\(A\)发生一次的概率为\(p\),则事件\(A\)\(n\)次伯努利试验中发生\(k\)次的概率为上述的分布律
    2. 记号:\(X\sim b(n,p)\)
    3. \(n=1\) 时二项分布就是(0-1)分布
  3. 泊松分布
    1. 分布律

    \[P\{X=k\} = \frac{\lambda^ke^{-\lambda}}{k!},k=0,1,2,\dots \]

    1. 记号:\(X\sim \pi(\lambda)\)
    2. 泊松定理:设\(\lambda>0\)是一个常数,\(n\)是任意正整数,设\(np_n=\lambda\),则对于任意固定的非负整数\(k\),有

    \[\lim_{n\to\infty}\binom{n}{k}p_n^k(1-p_n)^{n-k} = \frac{\lambda^ke^{-\lambda}}{k!} \]

    \(n\)很大,\(p_n\)很小的时候,可以用泊松分布的公式来近似二项分布

3. 随机变量的分布函数

  1. 分布函数:设\(X\)是一个随机变量,\(x\)是任意常数,函数\(F(x)=P\{X\le x\},-\infty < x < \infty\) 称为\(X\)分布函数
  2. 分布函数\(F(x)\)的性质
    1. \(F(x)\)是一个 不减 的函数
    2. \(0\le F(x)\le 1\),并且\(F(-\infty)=0,F(\infty)=1\)
    3. \(F(x+0) = F(x)\),即分布函数必须是 右连续
  3. 离散型随机变量的分布函数:阶梯型函数,在\(X=x_k(k=1,2,\dots)\)处有跳跃,其跳跃值为\(p_k=P\{X=x_k\}\)
    image

4. 连续型随机变量及其概率密度

1. 连续型随机变量

  1. 连续型随机变量:如果对于随机变量\(X\)的分布函数\(F(x)\),存在非负可积函数\(f(x)\),对于任意的实数\(x\)\(F(x) = \int_{-\infty}^{x}f(t)dt\),则称\(X\)为连续型随机变量
  2. 概率密度函数:\(f(x)\)称为\(x\)的概率密度函数,简称概率密度
  3. 概率密度函数的性质
    1. 非负性:\(f(x)\ge 0\)

    2. 完备性:\(\int_{-\infty}^{\infty}f(x)dx = 1\)

    3. 对于任意的实数\(x_1,x_2(x_1\le x_2)\),有

      \[P(x_1<X\le x_2) = F(x_2)-F(x_1)=\int_{x_1}^{x_2}f(x)dx \]

    4. \(f(x)\)\(x\)点处 连续,则\(F^{'}(x) = f(x)\)

  4. 注意事项
    1. 连续性随机变量的分布函数要求连续,而对于一般的分布函数要求的是右连续即可
    2. 对于连续型随机变量,在某一个点上的概率为 0,即\(P(a) = 0\),但是这不代表 \(x=a\) 是不可能事件
    3. 对于连续型随机变量,\(P(a,b) = P[a,b] = P(a,b] = P[a,b)\)

2. 连续型随机变量的分布

  1. 均匀分布

    1. 若对于连续型随机变量\(X\)具有如下概率密度,则称\(X\)在区间\((a,b)\)上服从 均匀分布,记为\(X\sim U(a,b)\)

      \[f(x)=\left\{\begin{matrix} \frac{1}{b - a},& a<x<b \\ 0,& otherwise \end{matrix}\right. \]

    2. 分布函数

      \[F(x) = \left\{\begin{matrix} 0,&x<a\\ \frac{x-a}{b-a},&a\le x<b\\ 1,&x\ge b \end{matrix}\right. \]

    3. \(f(x)\)以及\(F(x)\)的函数图像image
  2. 指数分布

    1. 若对于连续型随机变量\(X\)具有如下概率密度,则称 \(X\) 是服从 \(\theta(\theta >0)\)指数分布

      \[f(x)=\left\{\begin{matrix} \frac{1}{\theta}e^{-\frac{x}{\theta}},& x>0 \\ 0,& otherwise \end{matrix}\right. \]

    2. 分布函数

      \[F(x)=\left\{\begin{matrix} 1 - e^{-\frac{x}{\theta}},& x > 0 \\ 0,& otherwise \end{matrix}\right. \]

    3. 性质:无记忆性:即\(P(X>s+t\mid X>s)=P(X>t)\)
    4. \(f(x)\)以及\(F(x)\)的函数图像image
  3. 正态分布

    1. 若对于连续型随机变量\(X\)具有如下概率密度,则称\(X\)服从\(\mu,\sigma\)正态分布或者高斯分布,记为\(X\sim N(\mu,\sigma^2)\)image

      \[f(x) = \frac{1}{\sqrt{2\pi}\sigma}e^{-\frac{(x-\mu)^2}{2\sigma^2}},\qquad-\infty<x<\infty \]

    2. 分布函数

      \[F(x) = \frac{1}{\sqrt{2\pi}\sigma}\int_{-\infty}^{x}e^{-\frac{(t-\mu)^2}{2\sigma^2}}dt \]

    3. 性质

      1. 曲线关于\(x = \mu\)对称,且\(\forall h>0, P(\mu-h<X\le \mu) = P(\mu < X \le \mu + h)\)
      2. \(x=\mu\)时,取到最大值\(f_{max}(x)=f(\mu)=\frac{1}{\sqrt{2\pi}\sigma}\)
      3. \(x=\mu \pm \sigma\)处有拐点,且曲线以\(Ox\)轴为渐近线
      4. 如果固定\(\sigma\),那么改变\(\mu\)的值图形就会左右平移
      5. 如果固定\(\mu\),当\(\sigma\)越小的时候,图形越尖;\(\sigma\)越大图形越扁
    4. 标准正态分布:\(\mu=0,\sigma=1\)

      1. 概率密度:\(\varphi(x)=\frac{1}{\sqrt{2\pi}}e^{-\frac{x^2}{2}}\)

      2. 分布函数:\(\varPhi(x)=\frac{1}{\sqrt{2\pi}}\int_{-\infty}^xe^{-\frac{t^2}{2}}dt\)image

      3. 性质:\(\varPhi(-x) = 1-\varPhi(x)\)

      4. 转换:如果随机变量\(X\sim N(\mu,\sigma^2)\),则\(Z=\frac{X-\mu}{\sigma}\sim N(0,1)\)

    5. \(3\sigma\)法则:尽管正态变量的取值范围是\((-\infty,\infty)\),但是它落在\((\mu-3\sigma,\mu+3\sigma)\)的概率是\(99.74\%\),几乎是肯定的事情

    6. \(\alpha\)分位:假设\(X\sim N(0,1)\),那么如果 \(z_\alpha\) 满足\(P(X>z_\alpha)=\alpha,0<\alpha<1\),那么\(z_\alpha\)为标准正态分布的\(\alpha\)分位数image

      • \(\varphi(x)\)的对称性可知:\(z_{1-\alpha}=-z_\alpha\)

5. 随机变量的函数的分布

1. 离散型随机变量

  • 对于离散型随机变量\(X\),如果有\(Y=g(X)\),那么 \(Y\)的分布律就是\(X\)在函数\(g\)的作用产生的值再对应相等求和即可

2. 连续型随机变量

  1. 标准求法:对于连续型随机变量,需要由随机变量\(X\)的概率密度去求随机变量 \(Y=g(X)\) 的概率密度;解决这类问题的一般方法是:
    1. 求出\(Y\)的分布函数的表达式
    $$
    F_Y(y)=P(Y\le y)=P(g(X)\le y)=P(X\in C_y),C_y={x|g(x)\le y}
    $$
    2. 利用连续型随机变量分布函数与概率密度的关系,求导数即可得到所求概率密度
  2. 定理:设随机变量\(X\)具有概率密度 \(f_X(x)\) , 又设函数\(g(x)\)处处可导且有 \(g^{'}(x)>0\)(或恒有\(g^{'}(x)<0\)) , 则\(Y=g(X)\)是连续型随机变量,其概率密度如下,其中\(\alpha=min(g(-\infty),g(\infty)),\beta=max(g(-\infty),g(\infty))\),其中\(h(y)\)\(g(x)\)反函数

\[f_Y(y)=\left\{\begin{matrix} f_X[h(y)]|h^{'}(y)|,& \alpha<y<\beta \\ 0,& otherwise \end{matrix}\right. \]

  1. 注意事项
    1. \(g(x)\)不是单调函数不能用此定理
    2. \(f(x)\)在有限区间\([a, b]\)以外等于零,则只需假设在\([a,b]\)上恒有\(g^{'}(x)>0\)(或恒有 \(g^{'}(x)<0\)) , 此时\(\alpha=min\{ g(a), g(b)\}, \beta=max\{g(a), g(b)\}\)
  2. 补充定理:若\(g(x)\)在不相叠的区间上逐段严格单调且处处可导,其反函数分别为\(h_1(y),h_2(y),\dots\)且均为连续函数,那么\(Y = g(X)\)是连续型随机变量,其概率密度为
    $$
    f_Y(y)=f_X(h_1(y))|h_1(y)|+f_X(h_2(y))|h_2(y)|+\dots
    $$
posted @ 2022-10-23 11:09  RadiumStar  阅读(276)  评论(0编辑  收藏  举报