随机变量
定义
一般地,随机变量是从 Ω(样本空间)到实数域上的函数。
累积分布函数
F(x)=P(X≤x),x∈(−∞,∞)
离散随机变量
是只取有限值或至多可列无限值的随机变量。
一般地,能与整数集形成一一对应的集合就是可列无限集。
伯努利随机变量
频率函数为:
p(1)=pp(0)=1−pp(x)=0(x≠0,1)
二项分布
假设进行 n 次独立实验,每次实验成功的概率为 p,失败的概率为 1−p,那么成功的次数 X 参数为 n,p 的二项随机变量。
p(k)=Cknpk(1−p)n−k
泊松分布
泊松分布多出现在当 X 表示在一定的时间或空间内出现的事件个数这种场合。
当 n 较大,p 较小时,泊松频率函数可以用来近似二项概率。
参数为 λ 的泊松频率函数为:
p(k)=λkk!e−λ
推导
考察时间段 [0,1) 事件 A 发生的次数 X。
我们将时间段均匀划分为 n 段,并假定对于每个时间段,事件 A 恰好发生一次的概率与 1/n 成正比,设 p=λ/n。
因为 p 是很小的,所以我们可以将长度为 1/n 的时间段发生事件 A 次数大于 1 的概率看作是 0。
那么 X 显然是服从参数为 (n,p) 的二项分布的(记为 X∼B(n,p)),因此有
p(k)=Ckn(λn)k(1−λn)n−k
当 n→∞ 时,
Cknnk=1k!(1−λn)n−k=e−λ
故 p(k)=λkk!e−λ。
连续随机变量
密度函数
对于连续随机变量,频率函数被密度函数 f(x) 取代,密度函数具有性质:
f(x)≥0∫∞−∞f(x)dx=1
如果 X 是具有密度函数 f 的随机变量,那么它落在 (a,b) 的概率为:
P(a<x<b)=∫baf(x)dx
均匀密度
一般地,区间 [a,b] 的均匀密度是:
f(x)={1a−bx∈[a,b]0其它
指数密度
指数分布常用来刻画生命周期或等待时间。
密度函数为:
f(x)={λe−λxx≥00x<0
分布函数为:
F(x)={1−e−λxx≥00x<0
推导
假定事件 A 是无记忆性的,以无记忆性的元件寿命为例,这意味着从 0 时刻开始至少存活到到 t 时刻的概率等于 s 时刻开始至少存活至 s+t 时刻的概率是相等的。
有了这个假定,我们从 0 时刻开始考察,假设事件 A 未发生,时刻 ΔT 发生的概率为 p=λΔT。
记事件 A 在时刻 x 发生的概率密度为 f(x),那么事件 A 在时刻 x 发生(之前不发生)的概率为:
f(x)ΔT=(1−p)x/ΔT−1p
因此 f(x)=limΔT→0(1−λΔT)x/ΔT−1λ=λe−λx
正态分布
f(x)=1√2πσe−(x−μ)22σ2, x∈(−∞,+∞),μ∈(−∞,+∞), σ∈(0,+∞)
μ 称为均值,σ 称为标准差。
推导很复杂的样子 qwq
,待补。
随机变量的函数
X 为具有密度为 fX(x) 的随机变量,随机变量 Y=g(X)(其中 g 可微并在区间 I 上单调),那么 fY(y)=fX(g−1(y))|dg−1(y)dy|
推导
不妨设 g 单调递增。
FY(y)=P(Y≤y)=P(g(X)≤y)=P(X≤g−1(y))=FX(g−1(y)),对 y 求导即得:
fY(y)=fX(g−1(y))dg−1(y)dy
g 单调递减的情况完全类似,有 fY(y)=−fX(g−1(y))dg−1(y)dy
故我们统一写成 fY(y)=fX(g−1(y))|dg−1(y)dy|。
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· 如何编写易于单元测试的代码
· 10年+ .NET Coder 心语,封装的思维:从隐藏、稳定开始理解其本质意义
· .NET Core 中如何实现缓存的预热?
· 从 HTTP 原因短语缺失研究 HTTP/2 和 HTTP/3 的设计差异
· AI与.NET技术实操系列:向量存储与相似性搜索在 .NET 中的实现
· 地球OL攻略 —— 某应届生求职总结
· 周边上新:园子的第一款马克杯温暖上架
· Open-Sora 2.0 重磅开源!
· 提示词工程——AI应用必不可少的技术
· .NET周刊【3月第1期 2025-03-02】