[概率论与数理统计]笔记:2.1 随机变量及其分布
第二章 随机变量的分布与数字特征
2.1 随机变量及其分布
随机变量的概念
定义
定义在概念空间\((\Omega,P)\)上,取值为实数的函数\(X=X(\omega)(\omega\in \Omega)\)称为\((\Omega,P)\)上的一个随机变量.
理解
随机变量的作用在于将样本的文字描述转换为实数,是一个具体到抽象的过程。
举例:
投掷一枚硬币,记正面朝上次数为随机变量\(X\),则\(X\)作为样本空间\(\Omega=\{正面,反面\}\)上的函数定义为
记号
随机变量常见的记号有:\(X,Y,Z,\xi,\eta\)
\(\{\omega|X(\omega)=a\}\):表示满足某一特征的样本组成的事件,简记为\(\{X=a\}\).
事件的概率记为\(P\{X=a\}\),也可以记为\(P(X=a)\).
离散型随机变量的概率分布
定义
如果\(X\)的全部可能取值只有有限个或可数无穷多个,则称\(X\)是一个离散型随机变量。
设\(X\)的全部可能取值为\(\{x_i,i=1,2,\cdots\}\),记
则称\(\{p(x_i),i=1,2,\cdots\}\)为\(X\)的概率分布。\(p(x_i)\)也可以简记为\(p_i\)。
概率分布可以用表格的形式表示,称为概率分布表:
\(X\) | \(x_1\) | \(x_2\) | \(\cdots\) | \(x_i\) | \(\cdots\) |
---|---|---|---|---|---|
\(P\) | \(p_1\) | \(p_2\) | \(\cdots\) | \(p_i\) | \(\cdots\) |
性质
- \(p(x_i)\ge 0, \ i=1,2,\cdots\);
- \(\sum\limits_ip(x_i)=1\)
分布函数
定义
设\(X\)是随机变量,则称函数
为随机变量\(X\)的分布函数,记作\(X\sim F(x)\).
定义域:\(x\in\mathbb{R}\)
值域:\(F(x)\in[0,1]\)
分布函数是实函数。
性质
- \(F(x)\)不减:若\(x_1<x_2\),则\(F(x_1)\le F(x_2)\);
- \(F(-\infty)=0, \quad F(+\infty)=1\);
- \(F(x)\)右连续,至多可列个间断点.
- 离散型:右连续
- 连续型:连续
连续性条件:
- 极限值存在
- 函数值存在
- 极限值等于函数值
计算
\(F(x)=P\{X\le x\}\)
-
\(P\{X\le a\}=F(a)\)
-
\(P\{X>a\}=1-P\{X\le a\}=1-F(a)\)
-
\(P\{a<X\le b\}=P\{X\le b\}-P\{X\le a\}=F(b)-F(a)\)
-
\(P\{X=a\}=F(a)-F(a-0)\)
这里的\(F(a)\)对应区间\((-\infty,a]\),\(F(a-0)\)对应区间\((-\infty,a)\).
这里的\(-0\)可以理解为无穷小量,无限逼近\(a\),将\(a\)点排除在外。
-
\(P\{a\le X\le b\}=F(b)-F(a-0)\)
-
\(P\{X<a\}=F(a-0)\)
-
\(P\{X\ge a\}=1-F(a-0)\)
以上的这些等式是离散型和连续型都适用的。
事实上,连续型可以不考虑端点。
离散型随机变量的分布函数
离散型随机变量的分布函数\(F(x)\)是阶梯函数,跳跃点为\(X\)的每一个取值,跳跃高度为\(X\)在相应点处的概率。
连续型随机变量及其概率密度函数
连续型随机变量
定义
连续型随机变量是指如果随机变量\(X\)的所有可能取值不可以逐个列举出来,而是取数轴上某一区间内的任一点的随机变量。
概率密度函数
定义
如果存在一个非负可积的函数\(f(x)\),使得\(X\)的分布函数
则称\(f(x)\)为\(X\)的概率密度函数,简称密度函数.
性质
- \(f(x)\ge0,\quad x\in(-\infty,+\infty)\)
- \(\int_{-\infty}^{+\infty}f(x)dx=1\)
计算
- 通过密度函数的积分可以求\(X\)的取值落于任意区间上的概率:
- 对于任意实数\(x\),有:
对于指定的\(x\),\(f(x)\)的含义:(此时\(X\)取\(x\)附近的值)
即\(P(x<X<x+\Delta x)\approx f(x)\Delta x\)
- 在\(f(x)\)的连续点处,有:
这个等式联系了分布函数和密度函数。
使用教材:
《概率论与数理统计》第四版 中国人民大学 龙永红 主编 高等教育出版社