02 随机变量及其分布 | 概率论与数理统计
1. 随机变量
- 随机变量:设随机变量的样本空间为 \(S={e}\).\(X=X(e)\)是定义在样本空间\(S\)上的实值单值函数,则称\(X=X(e)\)为随机变量
2. 离散型随机变量及其分布律
1. 离散型随机变量
-
离散型随机变量:全部可能得到的值是有限个或者可列的无限多个的随机变量(有理数具有可列性)
-
分布律:离散型随机变量\(X\)的分布律为 \(P(X=x_k) = p_k,k=1,2,\dots\),也可以用表格表示:
\(X\) \(x_1\) \(x_2\) \(\cdots\) \(x_n\) \(\cdots\) \(p_k\) \(p_1\) \(p_2\) \(\cdots\) \(p_n\) \(\cdots\)
2. 几种重要的离散型随机变量
- (0-1)分布
- 分布律:\(P\{X=k\}=p^k(1-p)^{1-k},k=0,1(0<p<1)\)
- 二项分布
- 分布律
\[P\{X=k\} = \binom{n}{k}p^k(1-p)^{n-k} \]- 含义:对于一次伯努利试验,只有 \(A\) 和 \(\bar{A}\)两种结果。对于该伯努利试验,事件\(A\)发生一次的概率为\(p\),则事件\(A\)在\(n\)次伯努利试验中发生\(k\)次的概率为上述的分布律
- 记号:\(X\sim b(n,p)\)
- 当 \(n=1\) 时二项分布就是(0-1)分布
- 泊松分布
- 分布律
\[P\{X=k\} = \frac{\lambda^ke^{-\lambda}}{k!},k=0,1,2,\dots \]- 记号:\(X\sim \pi(\lambda)\)
- 泊松定理:设\(\lambda>0\)是一个常数,\(n\)是任意正整数,设\(np_n=\lambda\),则对于任意固定的非负整数\(k\),有
\[\lim_{n\to\infty}\binom{n}{k}p_n^k(1-p_n)^{n-k} = \frac{\lambda^ke^{-\lambda}}{k!} \]当\(n\)很大,\(p_n\)很小的时候,可以用泊松分布的公式来近似二项分布
3. 随机变量的分布函数
- 分布函数:设\(X\)是一个随机变量,\(x\)是任意常数,函数\(F(x)=P\{X\le x\},-\infty < x < \infty\) 称为\(X\)的 分布函数
- 分布函数\(F(x)\)的性质
- \(F(x)\)是一个 不减 的函数
- \(0\le F(x)\le 1\),并且\(F(-\infty)=0,F(\infty)=1\)
- \(F(x+0) = F(x)\),即分布函数必须是 右连续 的
- 离散型随机变量的分布函数:阶梯型函数,在\(X=x_k(k=1,2,\dots)\)处有跳跃,其跳跃值为\(p_k=P\{X=x_k\}\)
4. 连续型随机变量及其概率密度
1. 连续型随机变量
- 连续型随机变量:如果对于随机变量\(X\)的分布函数\(F(x)\),存在非负可积函数\(f(x)\),对于任意的实数\(x\)有\(F(x) = \int_{-\infty}^{x}f(t)dt\),则称\(X\)为连续型随机变量
- 概率密度函数:\(f(x)\)称为\(x\)的概率密度函数,简称概率密度
- 概率密度函数的性质
-
非负性:\(f(x)\ge 0\)
-
完备性:\(\int_{-\infty}^{\infty}f(x)dx = 1\)
-
对于任意的实数\(x_1,x_2(x_1\le x_2)\),有
\[P(x_1<X\le x_2) = F(x_2)-F(x_1)=\int_{x_1}^{x_2}f(x)dx \] -
若\(f(x)\)在\(x\)点处 连续,则\(F^{'}(x) = f(x)\)
-
- 注意事项
- 连续性随机变量的分布函数要求连续,而对于一般的分布函数要求的是右连续即可
- 对于连续型随机变量,在某一个点上的概率为 0,即\(P(a) = 0\),但是这不代表 \(x=a\) 是不可能事件
- 对于连续型随机变量,\(P(a,b) = P[a,b] = P(a,b] = P[a,b)\)
2. 连续型随机变量的分布
-
均匀分布
-
指数分布
- 若对于连续型随机变量\(X\)具有如下概率密度,则称 \(X\) 是服从 \(\theta(\theta >0)\) 的 指数分布\[f(x)=\left\{\begin{matrix} \frac{1}{\theta}e^{-\frac{x}{\theta}},& x>0 \\ 0,& otherwise \end{matrix}\right. \]
- 分布函数\[F(x)=\left\{\begin{matrix} 1 - e^{-\frac{x}{\theta}},& x > 0 \\ 0,& otherwise \end{matrix}\right. \]
- 性质:无记忆性:即\(P(X>s+t\mid X>s)=P(X>t)\)
- \(f(x)\)以及\(F(x)\)的函数图像
- 若对于连续型随机变量\(X\)具有如下概率密度,则称 \(X\) 是服从 \(\theta(\theta >0)\) 的 指数分布
-
正态分布
-
若对于连续型随机变量\(X\)具有如下概率密度,则称\(X\)服从\(\mu,\sigma\)的正态分布或者高斯分布,记为\(X\sim N(\mu,\sigma^2)\)
\[f(x) = \frac{1}{\sqrt{2\pi}\sigma}e^{-\frac{(x-\mu)^2}{2\sigma^2}},\qquad-\infty<x<\infty \] -
分布函数
\[F(x) = \frac{1}{\sqrt{2\pi}\sigma}\int_{-\infty}^{x}e^{-\frac{(t-\mu)^2}{2\sigma^2}}dt \] -
性质
- 曲线关于\(x = \mu\)对称,且\(\forall h>0, P(\mu-h<X\le \mu) = P(\mu < X \le \mu + h)\)
- 当\(x=\mu\)时,取到最大值\(f_{max}(x)=f(\mu)=\frac{1}{\sqrt{2\pi}\sigma}\)
- 在\(x=\mu \pm \sigma\)处有拐点,且曲线以\(Ox\)轴为渐近线
- 如果固定\(\sigma\),那么改变\(\mu\)的值图形就会左右平移
- 如果固定\(\mu\),当\(\sigma\)越小的时候,图形越尖;\(\sigma\)越大图形越扁
-
标准正态分布:\(\mu=0,\sigma=1\)
-
\(3\sigma\)法则:尽管正态变量的取值范围是\((-\infty,\infty)\),但是它落在\((\mu-3\sigma,\mu+3\sigma)\)的概率是\(99.74\%\),几乎是肯定的事情
-
\(\alpha\)分位:假设\(X\sim N(0,1)\),那么如果 \(z_\alpha\) 满足\(P(X>z_\alpha)=\alpha,0<\alpha<1\),那么\(z_\alpha\)为标准正态分布的上\(\alpha\)分位数
- 由\(\varphi(x)\)的对称性可知:\(z_{1-\alpha}=-z_\alpha\)
-
5. 随机变量的函数的分布
1. 离散型随机变量
- 对于离散型随机变量\(X\),如果有\(Y=g(X)\),那么 \(Y\)的分布律就是\(X\)在函数\(g\)的作用产生的值再对应相等求和即可
2. 连续型随机变量
- 标准求法:对于连续型随机变量,需要由随机变量\(X\)的概率密度去求随机变量 \(Y=g(X)\) 的概率密度;解决这类问题的一般方法是:
1. 求出\(Y\)的分布函数的表达式
$$
F_Y(y)=P(Y\le y)=P(g(X)\le y)=P(X\in C_y),C_y={x|g(x)\le y}
$$
2. 利用连续型随机变量分布函数与概率密度的关系,求导数即可得到所求概率密度 - 定理:设随机变量\(X\)具有概率密度 \(f_X(x)\) , 又设函数\(g(x)\)处处可导且有 \(g^{'}(x)>0\)(或恒有\(g^{'}(x)<0\)) , 则\(Y=g(X)\)是连续型随机变量,其概率密度如下,其中\(\alpha=min(g(-\infty),g(\infty)),\beta=max(g(-\infty),g(\infty))\),其中\(h(y)\)是\(g(x)\)的反函数
\[f_Y(y)=\left\{\begin{matrix}
f_X[h(y)]|h^{'}(y)|,& \alpha<y<\beta \\
0,& otherwise
\end{matrix}\right.
\]
- 注意事项
- 若\(g(x)\)不是单调函数不能用此定理
- 若\(f(x)\)在有限区间\([a, b]\)以外等于零,则只需假设在\([a,b]\)上恒有\(g^{'}(x)>0\)(或恒有 \(g^{'}(x)<0\)) , 此时\(\alpha=min\{ g(a), g(b)\}, \beta=max\{g(a), g(b)\}\)
- 补充定理:若\(g(x)\)在不相叠的区间上逐段严格单调且处处可导,其反函数分别为\(h_1(y),h_2(y),\dots\)且均为连续函数,那么\(Y = g(X)\)是连续型随机变量,其概率密度为
$$
f_Y(y)=f_X(h_1(y))|h_1(y)|+f_X(h_2(y))|h_2(y)|+\dots
$$
__EOF__

本文作者:RadiumGalaxy
本文链接:https://www.cnblogs.com/RadiumGalaxy/p/16818154.html
关于博主:评论和私信会在第一时间回复。或者直接私信我。
版权声明:本博客所有文章除特别声明外,均采用 BY-NC-SA 许可协议。转载请注明出处!
声援博主:如果您觉得文章对您有帮助,可以点击文章右下角【推荐】一下。您的鼓励是博主的最大动力!
本文链接:https://www.cnblogs.com/RadiumGalaxy/p/16818154.html
关于博主:评论和私信会在第一时间回复。或者直接私信我。
版权声明:本博客所有文章除特别声明外,均采用 BY-NC-SA 许可协议。转载请注明出处!
声援博主:如果您觉得文章对您有帮助,可以点击文章右下角【推荐】一下。您的鼓励是博主的最大动力!
标签:
Courses
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· 阿里最新开源QwQ-32B,效果媲美deepseek-r1满血版,部署成本又又又降低了!
· 单线程的Redis速度为什么快?
· SQL Server 2025 AI相关能力初探
· AI编程工具终极对决:字节Trae VS Cursor,谁才是开发者新宠?
· 展开说说关于C#中ORM框架的用法!