【概率论】随机变量

随机变量

定义

一般地,随机变量是从 Ω​(样本空间)到实数域上的函数。

累积分布函数

F(x)=P(Xx),x(,)

离散随机变量

是只取有限值或至多可列无限值的随机变量。

一般地,能与整数集形成一一对应的集合就是可列无限集。

伯努利随机变量

频率函数为:

p(1)=pp(0)=1pp(x)=0(x0,1)

二项分布

假设进行 n 次独立实验,每次实验成功的概率为 p,失败的概率为 1p,那么成功的次数 X 参数为 n,p 的二项随机变量。

p(k)=Cnkpk(1p)nk

泊松分布

泊松分布多出现在当 X 表示在一定的时间或空间内出现的事件个数这种场合。

n 较大,p 较小时,泊松频率函数可以用来近似二项概率。

参数为 λ 的泊松频率函数为:

p(k)=λkk!eλ

推导

考察时间段 [0,1) 事件 A 发生的次数 X

我们将时间段均匀划分为 n 段,并假定对于每个时间段,事件 A 恰好发生一次的概率与 1/n 成正比,设 p=λ/n

因为 p 是很小的,所以我们可以将长度为 1/n 的时间段发生事件 A 次数大于 1 的概率看作是 0

那么 X​​​ 显然是服从参数为 (n,p)​​​ 的二项分布的(记为 XB(n,p)​​​​​),因此有

p(k)=Cnk(λn)k(1λn)nk

n 时,

Cnknk=1k!(1λn)nk=eλ

p(k)=λkk!eλ​。

连续随机变量

密度函数

对于连续随机变量,频率函数密度函数 f(x)​ 取代,密度函数具有性质:

f(x)0f(x)dx=1

如果 X 是具有密度函数 f 的随机变量,那么它落在 (a,b) 的概率为:

P(a<x<b)=abf(x)dx

均匀密度

一般地,区间 [a,b] 的均匀密度是:

f(x)={1abx[a,b]0

指数密度

指数分布常用来刻画生命周期或等待时间。

密度函数为:

f(x)={λeλxx00x<0

分布函数为:

F(x)={1eλxx00x<0

推导

假定事件 A 是无记忆性的,以无记忆性的元件寿命为例,这意味着从 0 时刻开始至少存活到到 t​ 时刻的概率等于 s 时刻开始至少存活至 s+t 时刻的概率是相等的。

有了这个假定,我们从 0 时刻开始考察,假设事件 A 未发生,时刻 ΔT 发生的概率为 p=λΔT

记事件 A 在时刻 x 发生的概率密度f(x),那么事件 A 在时刻 x 发生(之前不发生)的概率为:

f(x)ΔT=(1p)x/ΔT1p

因此 f(x)=limΔT0(1λΔT)x/ΔT1λ=λeλx

正态分布

f(x)=12πσe(xμ)22σ2, x(,+),μ(,+), σ(0,+)

μ 称为均值σ​ 称为标准差。​

推导很复杂的样子 qwq,待补。

随机变量的函数

X 为具有密度为 fX(x) 的随机变量,随机变量 Y=g(X)(其中 g 可微并在区间 I 上单调),那么 fY(y)=fX(g1(y))|dg1(y)dy|

推导

不妨设 g 单调递增。

FY(y)=P(Yy)=P(g(X)y)=P(Xg1(y))=FX(g1(y)),对 y 求导即得:

fY(y)=fX(g1(y))dg1(y)dy

g 单调递减的情况完全类似,有 fY(y)=fX(g1(y))dg1(y)dy

故我们统一写成 fY(y)=fX(g1(y))|dg1(y)dy|

posted @   HinanawiTenshi  阅读(475)  评论(0编辑  收藏  举报
编辑推荐:
· 如何编写易于单元测试的代码
· 10年+ .NET Coder 心语,封装的思维:从隐藏、稳定开始理解其本质意义
· .NET Core 中如何实现缓存的预热?
· 从 HTTP 原因短语缺失研究 HTTP/2 和 HTTP/3 的设计差异
· AI与.NET技术实操系列:向量存储与相似性搜索在 .NET 中的实现
阅读排行:
· 地球OL攻略 —— 某应届生求职总结
· 周边上新:园子的第一款马克杯温暖上架
· Open-Sora 2.0 重磅开源!
· 提示词工程——AI应用必不可少的技术
· .NET周刊【3月第1期 2025-03-02】
点击右上角即可分享
微信分享提示