第二章 随机变量及其分布
随机变量,顾名思义,就是具有随机性的变量。什么叫有随机性?中公考研辅导老师将带领大家从随机试验开始看起。
所谓随机试验,就是具有如下特征的试验:“可重复”,“结果不唯一”,“无法预知”(试验前无法预知哪种结果出现)。如掷硬币,掷骰子。对于某个随机试验,我们把其结果收集起来构成一个集合,这就构成了该试验的样本空间。而样本空间的子集就是随机事件。所以随机事件即某些试验结果构成的集合。概率第一章的基本概念:样本空间、随机事件、必然事件、不可能事件、基本事件,均可以理解成特殊的集合(由随机试验的结果构成的集合):全集、子集、全集、空集、单点集。
随机变量是定义在样本空间上的单值函数。例如对于掷硬币这个随机试验,其样本空间为{正,反},我们可以在这个样本空间上定义一个随机变量:X(正)=1,X(反)=0。
关于随机变量的概念,我们不妨多思考一下,以增进和它的关系。套用一句广告词:你怎么对待随机变量,随机变量就怎么对待你。请思考如下几个问题:
1. 随机变量是个函数,这个函数是不是高数中的函数?
不少同学没有思考过这个问题,那就错过了深入理解随机变量的机会。高数中的函数是什么样子的?起码定义域是实数集或实数集的子集。而随机变量的定义域是样本空间。这说明二者是不同类型的函数。什么?函数还有不同类型?有这种疑惑的同学很可能没有好好看教材,在同济六版高数教材第6页,有一小段话,较为透彻地解答了该问题。大家可以通过翻书或听我唠叨几句这两种方式解决这个问题。ready?go!映射是两个集合A,B之间的对应关系,考虑非空集合A、B,对于集合A中的任一元素,若集合B中有唯一确定的元素与之对应,我们就把这种对应关系称为从A到B的映射。如果集合A、B均为实数集或其子集,我们把这个映射称为函数。如果定义域为一个一般的集合(非实数集或其子集),那么我们把这种映射称为泛函(泛函字面意思为广义的函数)。理解了这些概念后,我们再来看随机变量,不难发现它原来是个泛函(怪不得不好理解呢)。泛函的知识考研不要求,不必深究。
2. 随机变量能否表示随机事件?
这个问题也有不少同学感到困惑。我们以上面定义的这个随机变量为例,{X=1}是个随机事件吗?是。可以有两个理解角度:其一,它可以写成{X=1}={e|X(e)=1}={正},这是一种反对应:由函数因变量的取值反对应自变量的取值。大家可以体会一下如何用随机变量表示随机事件;其二,X有两种可能的取值0,1,并且以一定的概率取每个值,而可以考虑概率的事件自然是随机事件了。所以以后见到一个随机变量,我们不一定要弄清它是如何定义的(有时这是困难的),只要我们能分析出这个变量有若干种可能的取值,取每个值有相应的概率即可认可其为随机变量,进行下一步分析即可。
类似地,{X<=1}也是随机事件。而且这种方式表示的随机事件有重要应用。正如深挖群众提供的贪腐线索有可能揪出大老虎,深入理解基本概念可能会有意想不到的收获。由{X<=1}为随机事件,不难得到{X<=a}亦为随机事件(其中a为给定的实数)。进一步,{X<=x}是随机事件吗(x为变量,且不具有随机性)?给定x,{X<=x}为一个随机事件;若给定不同的x,就得到不同的随机事件。如果x的取值范围是全体实数,我们就得到了一系列的随机事件。而每个随机事件又可以与一个概率对应。这样,对于每个x,有唯一确定的实数与其对应,这就确定了函数关系。这个函数是与X有关的,我们称其为X的分布函数。是不是有点意外的收获?
走笔至此,我忍不住要说两句“形而上”的东西。为什么有同学感觉课上听懂了,课下却不会做题?一个重要的原因是上课是学生跟着老师的思路走,缺少主动探索和“试错”。我们碰到一道题就像路过一个十字路口,有前后左右四个方向可选,而最终我们会选择其中一个方向走下去。那为什么要选这个方向?很多时候,我们要用主动的试错去减少可能性,用试错去建立自己的经验系统,进而依据经验系统做决策。而这种试错最好在平时完成(在考场上试错就“悲剧”了)。
3. 为什么要引入随机变量?
随机变量是把随机试验的结果与实数对应起来,方便用数学工具处理。没有随机变量的状态,我们已经见识过了,就在概率的第一章。我们可以考虑随机事件,但每次说起来和写起来都不方便:事件中的元素可能是“正”和“反”,也可能是“1点”和“6点”,还可能是“中”和“不中”;相应地算概率可能是P{“正”},可能是P{“掷出偶数点”},还可能是P{“独立重复地射击10次,击中k次”}。而有了随机变量后,整个概率的世界就不同了:可以用P{X=1}表示掷硬币朝上的面为正面,表示掷骰子掷出偶数点,还可以表示射击命中,只需要修改随机变量X的定义即可;此外,我们可以进一步定义X的分布函数,那么高等数学就可以作为一个工具来为概率统计服务了,比如求极限,求导这些基本计算可以对分布函数进行。