bootstrap

bootstrap的数学定义

设随机样本X=[x1,x2,...,xn]是独立同分布样本,xiF(x),i=1,2,...,nR(X,F)为某个预先选定的随机变量,是X和F的函数。现要求根据观测样本估计R(X,F)的分布特征。例如,设θ=θ(F)为总体分布F的某个参数,Fn是观测样本X的经验分布函数,θ^=θ^(Fn)θ的估计,记估计误差为R(X,F)=θ^(Fn)θ(F),现由观测样本X=[x1,x2,...,xn]估计R(X,F)的分布特征,bootstrap方法实质就是一个再抽样过程,计算R(X,F)分布特征的基本步骤归纳如下:

1.基于样本进行自助抽样,构造出M个自助抽样子样本集,即bootstrap样本。

2.基于M个bootstrap样本,得到所求参数θ的M个取值,进而求出参数θ的分布及其统计量。

由抽样过程可以看出,Rn的统计特征近似于一个M(0,σ2)的正态分布。

 

σθ^=D(θ^)称为估计量θ^的标准误差。

假设:bootstrap样本的参数估计分别为θ^1,θ^2,...,θ^M,那么,

σ^θ^=1M1i=1M(θ^iθ¯)2

上式即为σθ^的bootstrap估计,其中θ¯为bootstrap样本均值。

 

参数θ的bootstrap偏差可以写为,θ¯θn,其中θn为原样本的参数θ的估计值。

 

参数θ估计的bootstrap均方误差为,E(θ^θ)2=σθ^2+(θ¯θn)2

posted @   ~宁静致远~  阅读(361)  评论(0编辑  收藏  举报
编辑推荐:
· Linux系列:如何用 C#调用 C方法造成内存泄露
· AI与.NET技术实操系列(二):开始使用ML.NET
· 记一次.NET内存居高不下排查解决与启示
· 探究高空视频全景AR技术的实现原理
· 理解Rust引用及其生命周期标识(上)
阅读排行:
· DeepSeek 开源周回顾「GitHub 热点速览」
· 物流快递公司核心技术能力-地址解析分单基础技术分享
· .NET 10首个预览版发布:重大改进与新特性概览!
· AI与.NET技术实操系列(二):开始使用ML.NET
· 单线程的Redis速度为什么快?
点击右上角即可分享
微信分享提示