1.2 统计量
1.2.1 统计量定义
统计量,由样本数据算出来的量,把样本中与所要解决的问题有关的信息集中起来。定义如下:
定义 1.2.1 统计量
由样本算出来的量称为统计量。准确地说,统计量是样本的函数。
此外要做两点说明:
-
统计量只与样本有关,不能与未知参数有关。例如,X∼N(a,sigma2),X1,⋯,Xn 是总体 X 中抽取的简单随机样本(独立同分布)。则 ∑ni=1Xi 是统计量,但当 a 和 σ 为未知参数时,∑ni=1(Xi−a) 和 ∑ni=1X2i/σ2 都不是统计量。
-
样本具有两重性:抽样前视为随机变量(或向量),抽样后视为具体的数。统计量是样本的函数,因此统计量也具有两重性。
1.2.2 常用统计量
(1) 样本均值
设 X1,⋯,Xn 是从总体 X 中抽取的样本,样本均值定义为
¯¯¯¯¯X=1nn∑i=1Xi
样本均值反映了总体均值的信息。
(2) 样本方差
设 X1,⋯,Xn 是从总体 X 中抽取的样本,样本方差定义为
S2=1n−1n∑i=1(Xi−¯¯¯¯¯X)2
样本均值反映了总体方差的信息。同时将 S 称为样本标准差,它反映了总体标准差的信息。有时也用下式作为样本方差的定义。
S2n=1nn∑i=1(Xi−¯¯¯¯¯X)2
样本均值和样本方差是两个最常用的统计量,它们具有如下三个性质:
-
∑ni=1(Xi−¯¯¯¯¯X)=0。
-
设非零数 a 和 b 为常数,做变换 Yi=aXi+b,i=1,2,⋯,n,则 Y1,⋯,Yn 的样本均值 ¯¯¯¯Y=a¯¯¯¯¯X,样本方差 S2Y=a2S2X。
-
对于任意常数 c,有
n∑i=1(Xi−c)2⩾n∑i=1(Xi−¯¯¯¯¯X)2
上式等号当且仅当 c=¯¯¯¯¯X 时成立。这个性质表明,在偏差平方和最小的准则下,用总体均值 a 的 n 次测量值的算术平均值估计 a 是最好的。
(3) 样本矩
设 X1,⋯,Xn 为从总体 X 中抽取的样本,称下式为样本 k 阶原点矩。
an,k=1nn∑i=1Xki,k=1,2,⋯
特别当 k=1 时,an,1=¯¯¯¯¯X,即样本均值,称下式为样本 k 阶中心矩。
mn,k=1nn∑i=1(Xi−¯¯¯¯¯X)k,k=1,2,⋯
特别当 k=2 时,mn,2=(n−1)S2/n。
样本的原点矩和中心距统称为样本矩。
(4) 二维随机向量的样本矩
设 (X1,Y1),⋯,(Xn,Yn) 为从二维总体 F(x,y) 中抽取的样本。
¯¯¯¯¯X=1nn∑i=1Xi,S2X=1n−1n∑i=1(Xi−¯¯¯¯¯X)2¯¯¯¯Y=1nn∑i=1Yi,S2Y=1n−1n∑i=1(Yi−¯¯¯¯Y)2SXY=1nn∑i=1(Xi−¯¯¯¯¯X)(Yi−¯¯¯¯Y)
分别将上式称为 X 和 Y 的样本均值、样本方差以及 X 和 Y 的样本协方差。
(5) 次序统计量及其相关统计量
设 X1,⋯,Xn 为从总体 X 中抽取的样本,将其按大小排列为 X(1)⩽X(2)⩽⋯⩽X(n),则将 (X(1),⋯,X(n)) 称为样本 (X1,⋯,Xn) 的次序统计量,其中任意一部分也称为次序统计量。
利用次序统计量定义下列统计量:
(5.1) 样本中位数
将下式称为样本中位数。
m1/2=
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· AI与.NET技术实操系列:基于图像分类模型对图像进行分类
· go语言实现终端里的倒计时
· 如何编写易于单元测试的代码
· 10年+ .NET Coder 心语,封装的思维:从隐藏、稳定开始理解其本质意义
· .NET Core 中如何实现缓存的预热?
· 分享一个免费、快速、无限量使用的满血 DeepSeek R1 模型,支持深度思考和联网搜索!
· 基于 Docker 搭建 FRP 内网穿透开源项目(很简单哒)
· 25岁的心里话
· ollama系列01:轻松3步本地部署deepseek,普通电脑可用
· 按钮权限的设计及实现