[概率论与数理统计]笔记：2.1 随机变量及其分布

第二章随机变量的分布与数字特征

2.1 随机变量及其分布

随机变量的概念

定义

定义在概念空间\((\Omega,P)\)上，取值为实数的函数\(X=X(\omega)(\omega\in \Omega)\)称为\((\Omega,P)\)上的一个随机变量.

理解

随机变量的作用在于将样本的文字描述转换为实数，是一个具体到抽象的过程。

举例：

投掷一枚硬币，记正面朝上次数为随机变量\(X\)，则\(X\)作为样本空间\(\Omega=\{正面，反面\}\)上的函数定义为

\[X(\omega)= \left\{ \begin{align*}{} & 1,\quad \omega=正面,\\ & 0,\quad \omega=反面. \end{align*} \right. \]

记号

随机变量常见的记号有：\(X,Y,Z,\xi,\eta\)

\(\{\omega|X(\omega)=a\}\)：表示满足某一特征的样本组成的事件，简记为\(\{X=a\}\).

事件的概率记为\(P\{X=a\}\)，也可以记为\(P(X=a)\).

离散型随机变量的概率分布

定义

如果\(X\)的全部可能取值只有有限个或可数无穷多个，则称\(X\)是一个离散型随机变量。

设\(X\)的全部可能取值为\(\{x_i,i=1,2,\cdots\}\)，记

\[p(x_i)=P\{X=x_i\},\quad i=1,2,\cdots \]

则称\(\{p(x_i),i=1,2,\cdots\}\)为\(X\)的概率分布。\(p(x_i)\)也可以简记为\(p_i\)。

概率分布可以用表格的形式表示，称为概率分布表:

\(X\)	\(x_1\)	\(x_2\)	\(\cdots\)	\(x_i\)	\(\cdots\)
\(P\)	\(p_1\)	\(p_2\)	\(\cdots\)	\(p_i\)	\(\cdots\)

性质

\(p(x_i)\ge 0, \ i=1,2,\cdots\)；
\(\sum\limits_ip(x_i)=1\)

分布函数

定义

设\(X\)是随机变量，则称函数

\[F(x)=P\{X\le x \},\quad x\in(-\infty,+\infty) \]

为随机变量\(X\)的分布函数，记作\(X\sim F(x)\).

定义域：\(x\in\mathbb{R}\)

值域：\(F(x)\in[0,1]\)

分布函数是实函数。

性质

\(F(x)\)不减：若\(x_1<x_2\)，则\(F(x_1)\le F(x_2)\)；
\(F(-\infty)=0, \quad F(+\infty)=1\)；
\(F(x)\)右连续，至多可列个间断点.
- 离散型：右连续
- 连续型：连续

连续性条件：

极限值存在

函数值存在

极限值等于函数值

计算

\(F(x)=P\{X\le x\}\)

\(P\{X\le a\}=F(a)\)
\(P\{X>a\}=1-P\{X\le a\}=1-F(a)\)
\(P\{a<X\le b\}=P\{X\le b\}-P\{X\le a\}=F(b)-F(a)\)
\(P\{X=a\}=F(a)-F(a-0)\)

这里的\(F(a)\)对应区间\((-\infty,a]\)，\(F(a-0)\)对应区间\((-\infty,a)\).

这里的\(-0\)可以理解为无穷小量，无限逼近\(a\)，将\(a\)点排除在外。

\(P\{a\le X\le b\}=F(b)-F(a-0)\)
\(P\{X<a\}=F(a-0)\)
\(P\{X\ge a\}=1-F(a-0)\)

以上的这些等式是离散型和连续型都适用的。

事实上，连续型可以不考虑端点。

离散型随机变量的分布函数

离散型随机变量的分布函数\(F(x)\)是阶梯函数，跳跃点为\(X\)的每一个取值，跳跃高度为\(X\)在相应点处的概率。

连续型随机变量及其概率密度函数

连续型随机变量

定义

连续型随机变量是指如果随机变量\(X\)的所有可能取值不可以逐个列举出来，而是取数轴上某一区间内的任一点的随机变量。

概率密度函数

定义

如果存在一个非负可积的函数\(f(x)\)，使得\(X\)的分布函数

\[F(x)=P\{X\le x\}=\int_{-\infty}^xf(t)dt \]

则称\(f(x)\)为\(X\)的概率密度函数，简称密度函数.

性质

\(f(x)\ge0,\quad x\in(-\infty,+\infty)\)
\(\int_{-\infty}^{+\infty}f(x)dx=1\)

计算

通过密度函数的积分可以求\(X\)的取值落于任意区间上的概率：

\[P\{a<X\le b\}=F(b)-F(a)=\int_a^bf(x)dx \]

对于任意实数\(x\)，有：

\[P\{X=x\}=0 \]

对于指定的\(x\)，\(f(x)\)的含义：（此时\(X\)取\(x\)附近的值）

\[\lim\limits_{\Delta x\to0}\frac{P\{x<X<x+\Delta x\}}{\Delta x}= \lim\limits_{\Delta x\to 0}\frac{\int_x^{x+\Delta x}f(x)dx}{\Delta x}= f(x) \]

即\(P(x<X<x+\Delta x)\approx f(x)\Delta x\)

在\(f(x)\)的连续点处，有：

\[F'(x)=f(x) \]

这个等式联系了分布函数和密度函数。

使用教材：
《概率论与数理统计》第四版中国人民大学龙永红主编高等教育出版社

posted @ 2023-01-03 19:23 feixianxing 阅读(817) 评论(0) 收藏举报

刷新页面返回顶部

feixianxing