概率论与数理统计(二)—— 随机变量及其分布
独立重复试验
最最重要的一种,试验批次是独立的,且概率不变
其中最简单的一个是贝努力试验,只有两种独立重复结果的试验就叫贝努力试验
两点分布
只做一次贝努力试验,\(E = 1 \times p + 0 \times (1-p) = p\)
二项分布
N重贝努力试验,记\(B_k\)为n次中B出现k次的概率,\(P(B_k) ={n \choose k}p^k (1-p)^{n-k} , k = 0, 1,...n\)
$ b(k, n, p) = {n \choose k}p^k (1-p)^{n-k}$
之和为1,是一个二项式展开,因此叫二项分布
可见\(b(k, n, p)\) 是有最大值的,对应的项叫中心项,对应的k是最可能的成功次数
exp1:
N件中有M件次品,进行n次有放回抽样,抽到k见次品的概率p?
\(b(k; n, \frac{M}{N} )\)
exp2:
一大批原件中10%是坏的,现抽20个,求都是好的的概率p?
由于“一大批”,可以认为是独立重复试验
\(b(20; 20, 10\%) = 0.9^{20}\)
exp3:
每颗子弹命中目标的概率是0.01,现发射500次,则命中目标最可能是多少次,病求出相应的p
\(b(k; 500, 0.01)\),根据二项分布的特点,取最大时 \(k = (n+1)p = 5\)
p感觉很难算
因此,二项分布的近似计算:
- n很大时,极限定理,中心极限定理
- 泊松分布近似
泊松分布
服从 $\lambda $ 的泊松分布
既然是一个分布,概率的和肯定要为1
其实就是\(e^x\) 的泰勒展开
作用:
- 作为二项分布的近似,且只有一个参数 \(\lambda\)
- 服从泊松分布的现象:...
- “基本分布”:用于构造其他分布的基本分布
在贝努力试验中,
以\(P_n\)表示 A 出现的概率(\(P_n\) 与 n 有关)
若\(np \to \lambda\),则当 \(n \to \infty\) 时,$b(k; n, p) \to \frac{\lambda ^ k}{k!} e^{- \lambda } $
n大,p小,np 大小适中
实际情况中效果怎么样呢:很好
设三胞胎出生 \(p=10^{-4}\),\(n=100000\),计算\(k=0,1,2\)?
可以看出来非常接近
连续性随机变量
设随机变量Z的分布函数为F(x),如果存在非负函数 f(x),使得:$F(x) = \int_{-\infty}^{x}f(t)dt $
则称Z为连续性随机变量,f(x)为Z的概率密度(函数)
常见的三种连续性随机性变量
均匀分布
指数分布
Z服从参数为\(\lambda\)的指数分布
还有一种写法:
\(\theta\) 的含义后面会将
一个有趣的性质:
与X无关,之前发生的事情与后面无关,这种性质就做“无记忆性”
指数分布是唯一的具有无记忆性的连续型概率分布
例如:已经活了10岁,再活10岁的概率没变(永葆青春型)
正态分布
Z为服从参数\(\mu\) 和 \(\sigma\) 的正态分布
\(Z\sim N(0,1)\) 标准正态分布,也可以用\(\varphi(x)\) 表示
线性变换:
令 \(Y=\frac{Z-\mu}{\sigma}, Y \sim N(0,1)\)
随机变量的函数的分布
先求分布函数,再求概率密度函数
密度变换公式
设Z的概率密度函数为\(p(x)\),\(y=f(x)\) 在(a, b) 上严格单调连续,且存在唯一的反函数 \(x=h(y)\),且${h}'(y) $ 连续,则\(Y=f(Z)\) 也是连续型随机变量,其密度函数为: