Markov & Chebyshev Inequality
示性函数
I(A)={1,A happen 0,A not happen
对于事件A,如果对于样本点ω有示性函数
IA(ω)={1,ω∈A0,ω∉A
那么可以证明
E[IA]=∑ωIA(ω)×P(ω)=1×P(A)=P(A)
Markov Inequality
如果X是一个非负随机变量,那么对于任意的a>0,有
P(X≥a)≤E[X]a
这个不等式粗略刻画了随机变量取值大于等于a的概率上界。
proof
我们定义示性函数,固定正数a,那么有
I(X≥a)={1,X≥a0,X<a
那么我们可以得到:
I(X≥a)≤Xa
因此我们可以得到一个不等式
P(X≥a)=∑xP(x)I(X≥a)≤∑xP(x)Xa=E[X]a
proof end
Chebyshev Inequality
如果X是一个随机变量,那么对于任意的ϵ>0,有
P(|X−E[X]|≥ϵ)≤var(X)ϵ2
这个不等式粗略刻画了随机变量取值与期望值的偏离程度。使用了随机变量的期望与方差的信息。
proof
我们定义示性函数
I((X−E[X])2≥ϵ2)={1,(X−E[X])2≥ϵ20,(X−E[X])2<ϵ2
我们可知
I((X−E[X])2≥ϵ2)≤(X−E[X])2ϵ2
因此我们可以得到一个不等式
P(|X−E[X]|≥ϵ)=P((X−E[X])2≥ϵ2)=∑xP(x)I((X−E[X])2≥ϵ2)≤∑xP(x)(X−E[X])2ϵ2=var(X)ϵ2
proof end
切比雪夫不等式并不要求随机变量非负
依概率收敛
数列的收敛
若对于任意的ϵ>0,存在N,当n>N时,有|an−a|<ϵ,则称数列an收敛于a,记为limn→∞an=a
随机变量序列的收敛
若对于任意的ϵ>0,有limn→∞P(|Yn−a|≥ϵ)=0,则称随机变量序列Yn依概率收敛于a,记为YnP→a
如果我们将其中的lim展开,有
对于任意的ϵ>0,有对于任意的δ>0,存在N,当n>N时,有P(|Yn−a|≥ϵ)<δ,则称随机变量序列Yn依概率收敛于a,记为YnP→a
Laws of Large Numbers
Weak Law of Large Numbers
弱大数定律是指,在大样本的情况下,样本的经验均值会以很大概率接近随机变量的期望。
我们考虑随机变量序列X1,X2,⋯,Xn.我们定义随机变量序列的经验均值为Mn=1N∑ni=1Xi,注意到Mn也是一个随机变量。
如果对于任意的ϵ>0, 有
limn→∞P(|Mn−E[Mn]|≥ϵ)=0
则称随机变量序列X1,X2,⋯,Xn满足弱大数定律。也称Mn依概率收敛于E[Mn]
现在我们开始一一分析各个大数定律
限制方差的大数定律--马尔可夫大数定律
任取ϵ>0,有
P(|Mn−E[Mn]|≥ϵ)≤var(Mn)ϵ2
其中var(Mn)=var(∑ni=1Xi)n2,因此
P(|Mn−E[Mn]|≥ϵ)≤var(∑ni=1Xi)n2ϵ2
如果limn→∞var(∑ni=1Xi)n2=0, 那么Mn满足弱大数定律。
限制随机变量不相关+方差有界的大数定律--切比雪夫大数定律
如果在 Markov 大数定律中,我们假设Xi两两不相关,那么var(∑ni=1Xi)=∑ni=1var(Xi)
同时如果所有的Xi的方差都有上界σ2,那么
P(|Mn−E[Mn]|≥ϵ)≤var(∑ni=1Xi)n2ϵ2=∑ni=1var(Xi)n2ϵ2≤nσ2n2ϵ2=σ2nϵ2
因此得到结论:如果Xi两两不相关,且有共同上界σ2,那么Mn满足弱大数定律。
限制独立同分布+方差有限的大数定律
如果Xi是独立同分布的随机变量,且有限方差σ2,那么
P(|Mn−E[Mn]|≥ϵ)≤var(∑ni=1Xi)n2ϵ2=nσ2n2ϵ2=σ2nϵ2
满足弱大数定律,并且此时E[Mn]=E[X]
限制独立同分布+二项分布--伯努利大数定律
如果Xi是独立同分布的伯努利随机变量,那么Mn满足弱大数定律。
同时可以进行扩展,我们将一个事件A嵌入一个示性函数中,转换为一个伯努利随机变量,那么我们可以得到
E[1nn∑i=1IA,i]=1nn∑i=1E[IA,i]=1nn∑i=1P(A)=P(A)
又因为IA,i独立同分布且有限方差,因此Mn满足弱大数定律,可得A的频率收敛于概率。
方差无界的大数定律--辛钦大数定律
如果Xi是独立同分布且期望有界的随机变量,但是方差无界,那么Mn满足弱大数定律。
Strong Law of Large Numbers
强大数定律是指,样本的经验均值会以概率 1 收敛于随机变量的期望。
若有独立同分布的随机变量序列X1,X2,⋯,Xn,那么
P(limn→∞Mn=E[X])=1
可以理解为,在一个无限序列 X_1, X_2, \cdots, X_n 的样本空间中,存在一个子集满足Mn=E[X],这个子集的概率为 1。
Central Limit Theorem
大数定律研究了随机变量序列的经验均值与期望之间的联系,而中心极限定理研究了随机变量序列经验均值的分布。
Lindeberg-Levy/独立同分布 Central Limit Theorem
如果Xi是独立同分布的随机变量,且有限期望μ和方差σ2,那么
limn→∞P(∑ni=1Xi−nμ√nσ≤x)=Φ(x)
即Mn依分布收敛于正态分布。
独立不同分布下的中心极限定理
pass
参考
大数定律与中心极限定理
概率导论
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· 无需6万激活码!GitHub神秘组织3小时极速复刻Manus,手把手教你使用OpenManus搭建本
· Manus爆火,是硬核还是营销?
· 终于写完轮子一部分:tcp代理 了,记录一下
· 别再用vector<bool>了!Google高级工程师:这可能是STL最大的设计失误
· 单元测试从入门到精通