概率论笔记（2）

笔记大部分内容来自于书《概率论与数理统计》，侵删

第二章随机变量

2.1随机变量及其分布函数

随机变量：对样本空间 $\Omega$ 的每一个元素 $e$ ，有一个实数 $X(e)$ 与之对应，这样定义在 $\Omega$ 上的实值单值函数 $X=X(e)$ 就称为随机变量

样本空间->实数轴上的值/范围，P(实数轴上的值/范围)->概率

$X$ 的分布函数： $X$ 是随机变量， $x$ 是任意实数，函数 $F(x)=P\left\{ X\leq x\right\}$ 称为X的分布函数
对任意实数 $x_{1},x_{2}(x_{1}<x_{2})$ ，有 $P\left \{ x_{1}< X\leq x_{2} \right \}= P\left \{ X\leq x_{2} \right \}-P\left \{ X\leq x_{1} \right \}=F(x_{2})-F(x_{1})$
分布函数具有的基本性质：

$F(x)$ 为单调不递减函数
$0\leq F(x)\leq 1$ ，且
$\lim_{x->+\infty }F(x)=1$ ，常记为 $F(+\infty )=1$
$\lim_{x->-\infty }F(x)=0$ ，常记为 $F(-\infty )=0$
$F(x+0)=F(x)$ ，即 $F(x)$ 为右连续

2.2离散型随机变量及其分布

离散型随机变量：随机变量的取值为有限个或可数无穷多个
离散型随机变量 $X$ 的概率分布（分布律）： $P\left\{ X=x_{k}\right\} =p_{k}, k=1,2,...$
任一离散型随机变量的分布律 $\left\{ p_{k}\right\}$ 两个基本性质

非负性（ $p_{k}\geq 0, k=1,2,...$ ）
归一性（ $\sum_{k=1}^{\infty} p_{k}=1$ ）

反过来，具有上述两个性质的数列 $\left\{ p_{k}\right\}$ ，一定可以作为某一个离散型随机变量的分布律

两点分布：
若随机变量 $X$ 只可能取 $x_{1}$ 与 $x_{2}$ 两值，它的分布律为
$P\left \{X=x_{1}\right \}=1-p, 0<p<1$
$P\left \{X=x_{2}\right \}=p$
则称 $X$ 服从参数为 $p$ 的两点分布
$X\sim (0-1)$ 分布，当 $x_{1}=0,x_{2}=1$ 时，两点分布也叫做(0-1)分布

二项分布：
若随机变量 $X$ 的分布律为 $P\left \{ X=k\right \} =C_{n}^{k} p^{k}(1-p)^{n-k}, k=0,1,...,n$
则称 $X$ 服从参数为 $n,p$ 的二项分布，记作 $X\sim b(n,p)$
二项分布可以作为描述 $n$ 重伯努利试验中事件A出现次数的数学模型
(0-1)分布是二项分布在 $n=1$ 时的特殊情形，故也可写成 $P\left \{X=k\right \}=p^{k}q^{1-k},k=0,1;q=1-p$
定理：
设 $\xi \sim B(n,p)$ ，则当 $k=ent((n+1)p)$ 时（ent是下取整）， $b(k;n,p)$ 的值最大，若 $(n+1)p$ 为整数，则 $b(k;n,p)=b(k-1;n,p)$ 同为最大值
（可以用二项分布的后一项比前一项，分析比值来证明）

泊松定理：
设 $np_{n}=\lambda$ （ $\lambda >0$ 是一常数, $n$ 是任意正整数），则对任意一固定的非负整数 $k$ ，有
$\lim_{n\rightarrow \infty}C_{n}^{k}p_{n}^{k}\left ( 1-P_{n} \right )^{n-k}= \frac{\lambda ^{k}e^{-\lambda }}{k!}$
此定理表明当 $n$ 很大 $p$ 很小时，有以下近似公式 $C_{n}^{k}p^{k}\left ( 1-P \right )^{n-k}\approx \frac{\lambda ^{k}e^{-\lambda }}{k!}$ ，其中 $\lambda =np$
二项分布的泊松公式常用于研究稀有事件

泊松分布：
若随机变量 $X$ 的分布律为
$P\left \{ X=k\right \} = \frac{ \lambda ^{k}e^{-\lambda} }{k!},k=0,1,2,...$
其中 $\lambda > 0$ 是常数，则称 $X$ 服从参数为 $\lambda$ 的泊松分布，记为 $X \sim P(\lambda )$
泊松分布可以作为描述大量试验中稀有事件出现的次数的概率分布情况的一个数学模型
$F(x)=P\left \{ X \leq x \right \} = \sum_{x_{k}\leq x}P\left \{ X = x_{k} \right \} = \sum_{x_{k} \leq x}p_{k}$

2.3连续型随机变量及其分布

讨论连续型随机变量在某点的概率是毫无意义的（总是0）
因此计算连续型随机变量的区间概率时不必考虑区间端点的情况
事件 $\left \{ X = a\right \}$ 是“零概率事件”但不是“不可能事件”

连续型随机变量及其概率密度函数（概率密度/密度函数）：
若对随机变量 $X$ 的分布函数 $F(x)$ ，存在非负函数 $f(x)$ ，使对于任意实数 $x$ ，有
$F(x)=\int_{-\infty }^{x}f(t)dt$
则称 $X$ 为连续型随机变量， $f(x)$ 称为 $X$ 的概率密度函数

概率密度函数的性质：

$f(x)\geq 0$
$\int_{-\infty }^{\infty}f(x)dx=1$
$P\left \{ x_{1} < X \leq x_{2}\right \} = F(x_{2})-F(x_{1}) = \int_{x_{1}}^{x_{2}}f(x)dx$
若 $f(x)$ 在 $x$ 点连续，则有 $F'(x)=f(x)$

反过来，任一满足以上1、2两个性质的函数 $f(x)$ ，一定可以作为某个连续型随机变量的密度函数

3种常见的连续型随机变量：均匀分布、指数分布、正态分布

均匀分布
若连续型随机变量 $X$ 具有概率密度
$f(x)=\left\{\begin{matrix}\frac{1}{b-a}, & a<x<b\\ 0, & 其它\end{matrix}\right.$
则称 $X$ 在区间 $(a,b)$ 上服从均匀分布，记作 $X\sim U(a,b)$
其分布函数为
$F(x)=\left\{\begin{matrix}0, & x<a\\ \frac{x-a}{b-a}, & a\leq x< b\\ 1, & x\geq b\end{matrix}\right.$
指数分布
若随机变量 $X$ 的密度函数为
$f(x)=\left\{\begin{matrix}\lambda e^{-\lambda x}, &X>0 \\ 0, &x\leq 0 \end{matrix}\right.$
其中 $\lambda >0$ 为常数，则称 $X$ 服从参数为 $\lambda$ 的指数分布，记作 $X\sim E(\lambda ).$
对应的分布函数为
$F(x)=\left\{\begin{matrix}1-e^{-\lambda x}, &x>0, \\ 0, &x\leq 0. \end{matrix}\right.$
指数分布常见于寿命分布，因为其具有无记忆性
对任意 $s,t>0$ 有
$P\left \{ X> s+t | X>s\right \}=P\left \{ X>t \right \}.$
正态分布
若连续型随机变量 $X$ 的密度函数为
$f(x)=\frac{1}{\sqrt{2\pi }\sigma }e^{-\frac{(x-e)^{2}}{2\sigma ^{2}}},-\infty < x<+\infty$
其中 $\mu ,\sigma (\sigma >0)$ 为常数，则称 $X$ 服从参数为 $\mu ,\sigma$ 的正太分布，记为 $X\sim N(\mu ,\sigma ^{2})$
关于 $\int_{-\infty}^{+\infty}f(x)dx=1$ 证略
（令 $I=\int_{-\infty}^{+\infty}e^{-\frac{t^{2}}{2}}dt$ ，极坐标积分变换算出 $I^{2}=2\pi$ ， $\int_{-\infty}^{+\infty}f(x)dx=\frac{1}{\sqrt{2\pi }}I=1$ ）
实际问题中大量的随机变量服从或近似服从正态分布
正太分布的性质：

曲线关于 $x=\mu$ 对称
曲线在 $x=\mu$ 处取最大值，离 $\mu$ 越远 $f(x)$ 值越小
曲线在 $\mu\pm \sigma$ 出有拐点
曲线以 $x$ 轴为渐进线
$\sigma$ 为精度参数， $\mu$ 为位置参数。固定 $\mu$ ， $\sigma$ 越小图形越尖陡；固定 $\sigma$ ， $\mu$ 变化则沿x轴平移。

当 $\mu =0,\sigma =1$ 时，称 $X$ 服从标准正太分布 $N(0,1)$ ，其密度函数表示为 $\varphi (x)$ ，分布函数表示为 $\Phi (x)$
（ $\Phi (-x) = 1-\Phi (x)$ ）
若 $X\sim N(\mu ,\sigma ^{2})$ ，则有 $\frac {X-\mu }{\sigma}\sim N(0,1)$ （证略）
所以有 $P \left \{ x_{1} < X \leq x_{2} \right \}=\Phi \left ( \frac{x_{2}-\mu }{\sigma } \right )-\Phi \left ( \frac{x_{1}-\mu }{\sigma } \right )$

3 $\sigma$ 原则：正太分布落在 $\left ( \mu -3\sigma ,\mu +3\sigma \right )$ 内是几乎肯定的事，可以认为有 $\left | X-\mu \right |< 3\sigma$

2.4随机变量函数的分布

任务：通过已知的随机变量分布求出与其有函数关系的另一个随机变量的分布
对于要求的随机变量函数的密度函数，一般先求出相应的分布函数再对分布函数求导得出密度函数

若连续型随机变量 $X$ 具有概率密度 $f_{X}(x),-\infty < x < +\infty$ ，又知 $Y=g(x)=X^{2}$
则 $Y$ 的概率密度为 $f_{Y}\left ( y \right )=\left\{\begin{matrix}\frac{1}{2\sqrt{y}}[f_{X}\left ( \sqrt{y} \right )+f_{X}\left (-\sqrt{y} \right )] & ,y>0\\ 0 & ,y\leq 0\end{matrix}\right.$
若 $X\sim N(0,1)$
则 $Y$ 的概率密度为 $f_{Y}\left ( y \right )=\left\{\begin{matrix} \frac{1}{\sqrt{2\pi }}y^{-\frac{1}{2}}e^{-\frac{y}{2}}&,y>0 \\ 0 & ,y\leq 0\end{matrix}\right.$ ，此时称 $Y$ 服从自由度为1的 $\chi ^{2}$ 分布

定理：
设随机变量 $X$ 具有概率密度 $f_{X}(x),-\infty < x < +\infty$ ，又设函数 $g'(x)$ 处处可导且 $g'(x)>0$ （或 $g'(x)<0$ ），则 $Y=g(X)$ 是连续型随机变量，其概率密度为
$f_{Y}(y)=\left\{\begin{matrix}f_{X}(h(y))|h'(y)| &,\alpha <y<\beta \\ 0 &,其它 \end{matrix}\right.$
其中 $\alpha =min\left \{ g(-\infty),g(+\infty) \right \},\beta =max\left \{ g(-\infty),g(+\infty) \right \}$ ， $h(y)$ 是 $g(x)$ 的反函数
（证略）