[概率论与数理统计]笔记:2.1 随机变量及其分布

第二章 随机变量的分布与数字特征

2.1 随机变量及其分布

随机变量的概念

定义

定义在概念空间\((\Omega,P)\)上,取值为实数的函数\(X=X(\omega)(\omega\in \Omega)\)称为\((\Omega,P)\)上的一个随机变量.

理解

随机变量的作用在于将样本的文字描述转换为实数,是一个具体到抽象的过程。

举例

投掷一枚硬币,记正面朝上次数为随机变量\(X\),则\(X\)作为样本空间\(\Omega=\{正面,反面\}\)上的函数定义为

\[X(\omega)= \left\{ \begin{align*}{} & 1,\quad \omega=正面,\\ & 0,\quad \omega=反面. \end{align*} \right. \]

记号

随机变量常见的记号有:\(X,Y,Z,\xi,\eta\)

\(\{\omega|X(\omega)=a\}\):表示满足某一特征的样本组成的事件,简记为\(\{X=a\}\).

事件的概率记为\(P\{X=a\}\),也可以记为\(P(X=a)\).

离散型随机变量的概率分布

定义

如果\(X\)的全部可能取值只有有限个或可数无穷多个,则称\(X\)是一个离散型随机变量

\(X\)的全部可能取值为\(\{x_i,i=1,2,\cdots\}\),记

\[p(x_i)=P\{X=x_i\},\quad i=1,2,\cdots \]

则称\(\{p(x_i),i=1,2,\cdots\}\)\(X\)概率分布\(p(x_i)\)也可以简记为\(p_i\)

概率分布可以用表格的形式表示,称为概率分布表:

\(X\) \(x_1\) \(x_2\) \(\cdots\) \(x_i\) \(\cdots\)
\(P\) \(p_1\) \(p_2\) \(\cdots\) \(p_i\) \(\cdots\)

性质

  1. \(p(x_i)\ge 0, \ i=1,2,\cdots\)
  2. \(\sum\limits_ip(x_i)=1\)

分布函数

定义

\(X\)是随机变量,则称函数

\[F(x)=P\{X\le x \},\quad x\in(-\infty,+\infty) \]

为随机变量\(X\)分布函数,记作\(X\sim F(x)\).

定义域\(x\in\mathbb{R}\)

值域\(F(x)\in[0,1]\)

分布函数是实函数。

性质

  1. \(F(x)\)不减:若\(x_1<x_2\),则\(F(x_1)\le F(x_2)\)
  2. \(F(-\infty)=0, \quad F(+\infty)=1\)
  3. \(F(x)\)右连续,至多可列个间断点.
    • 离散型:右连续
    • 连续型:连续

连续性条件:

  1. 极限值存在
  2. 函数值存在
  3. 极限值等于函数值

计算

\(F(x)=P\{X\le x\}\)

  • \(P\{X\le a\}=F(a)\)

  • \(P\{X>a\}=1-P\{X\le a\}=1-F(a)\)

  • \(P\{a<X\le b\}=P\{X\le b\}-P\{X\le a\}=F(b)-F(a)\)

  • \(P\{X=a\}=F(a)-F(a-0)\)

这里的\(F(a)\)对应区间\((-\infty,a]\)\(F(a-0)\)对应区间\((-\infty,a)\).

这里的\(-0\)可以理解为无穷小量,无限逼近\(a\),将\(a\)点排除在外。

  • \(P\{a\le X\le b\}=F(b)-F(a-0)\)

  • \(P\{X<a\}=F(a-0)\)

  • \(P\{X\ge a\}=1-F(a-0)\)

以上的这些等式是离散型连续型都适用的。

事实上,连续型可以不考虑端点。

离散型随机变量的分布函数

离散型随机变量的分布函数\(F(x)\)阶梯函数,跳跃点为\(X\)的每一个取值,跳跃高度为\(X\)在相应点处的概率。

连续型随机变量及其概率密度函数

连续型随机变量

定义

连续型随机变量是指如果随机变量\(X\)的所有可能取值不可以逐个列举出来,而是取数轴上某一区间内的任一点的随机变量。

概率密度函数

定义

如果存在一个非负可积的函数\(f(x)\),使得\(X\)的分布函数

\[F(x)=P\{X\le x\}=\int_{-\infty}^xf(t)dt \]

则称\(f(x)\)\(X\)概率密度函数,简称密度函数.

性质
  1. \(f(x)\ge0,\quad x\in(-\infty,+\infty)\)
  2. \(\int_{-\infty}^{+\infty}f(x)dx=1\)
计算
  1. 通过密度函数的积分可以求\(X\)的取值落于任意区间上的概率:

\[P\{a<X\le b\}=F(b)-F(a)=\int_a^bf(x)dx \]


  1. 对于任意实数\(x\),有:

\[P\{X=x\}=0 \]

对于指定的\(x\)\(f(x)\)的含义:(此时\(X\)\(x\)附近的值)

\[\lim\limits_{\Delta x\to0}\frac{P\{x<X<x+\Delta x\}}{\Delta x}= \lim\limits_{\Delta x\to 0}\frac{\int_x^{x+\Delta x}f(x)dx}{\Delta x}= f(x) \]

\(P(x<X<x+\Delta x)\approx f(x)\Delta x\)


  1. \(f(x)\)的连续点处,有:

\[F'(x)=f(x) \]

这个等式联系了分布函数密度函数


使用教材:
《概率论与数理统计》第四版 中国人民大学 龙永红 主编 高等教育出版社

posted @ 2023-01-03 19:23  feixianxing  阅读(422)  评论(0编辑  收藏  举报