06 样本及抽样分布 | 概率论与数理统计

1. 随机样本

1. 总体与个体

  1. 总体:研究对象的全体,即试验的全部可能观察值称为总体
  2. 个体:总体当中的每个对象,总体中的每个可能观察值成为个体
  3. 容量:总体中所包含的个体的个数称为总体的容量
  4. 总体按容量分类
    1. 有限总体:容量为有限的称为有限总体
    2. 无限总体:容量为无限的称为无限总体

2. 样本与样本值

  1. 样本:从总体X中随机的抽取n个个体X1,X2,,Xn,这样取得的X1,X2,,Xn称为来自总体X(分布函数相同)的一个 样本
  2. 样本容量:样本中个体的总数n
  3. 样本值:X1,X2,,Xn的一组观察值x1,x2,,xn
  4. 简单随机样本:在总体中抽取样本的目的是为了对总体的分布规律进行各种分析推断,这就要求抽取的样本能够反映总体的特点,为此必须对随机抽取样本的方法提出如下
    1. 独立性:X1,X2,,Xn是相互独立的随机变量
    2. 代表性:要求样本的每个Xi(i=1,2,,n)与总体X具有相同的分布
  5. 样本X1,X2,,Xn的特点
    1. 相互独立且与X同分布
    2. 如果总体X具有分布函数F(x),概率密度f(x),那么样本的分布函数以及概率密度为

      F(X1,X2,,xn)=i=1nF(xi), f(X1,X2,,xn)=i=1nf(xi)

2. 抽样分布

1. 统计量

  1. 统计量:设X1,X2,,Xn是来自总体X的一个样本,g(X1,X2,,Xn)X1,X2,,Xn的函数,如果g中不含任何的未知参数,则称g(X1,X2,,Xn)是一个 统计量
    1. 统计量是一个随机变量
    2. (x1,x2,,xn)是样本(X1,X2,,Xn)的观察值,那么g(x1,x2,,xn)g(X1,X2,,Xn)的观察值
  2. 常用的统计量:设X1,X2,,Xn是来自总体X的一个样本,(x1,x2,,xn)是其观察值
    1. 样本均值:X¯=1ni=1nXi
    2. 样本方差:S2=1n1i=1n(XiX¯)2=1n1(i=1nXi2nX¯2) (注意是n-1)
    3. 样本标准差:S=1n1i=1n(XiX¯)2
    4. 样本k阶原点矩:Ak=1ni=1nXik
    5. 样本k阶中心矩:Bk=1ni=1n(XiX¯)k
  3. 样本矩的性质
    1. 如果总体Xk阶矩E(Xk)=μk存在,则当n,AkPμk
    2. g(A1,A2,,An)Pg(μ1,μ2,,μn),其中g是连续函数

2. 经验分布函数

  1. 经验分布函数:记x1,x2,,xn是来自分布函数F(x)的总体X的样本观察值,X经验分布函数 记为Fn(x),定义为样本观察值x1,x2,,xn中小于等于指定值x所占的比例;记(xix)x1,x2,,xn中小于等于指定值x的个数,则

    Fn(x)=(xix)n, <x<+

  2. 经验函数的性质
    1. Fn(x)是不减函数
    2. 0Fn(x)1,且F()=0,F(+)=1
    3. Fn(x)右连续
    4. x1,x2,,xn各不相同时,Fn(x)以等概率1nx1,x2,,xn的离散型随机变量的分布函数
    5. 一般地,设x1,x2,,xn是总体F的一个容量为n的样本值,先将x1,x2,,xn按自小到大的次序排列,重新编号x(1)x(2)x(n),则经验分布函数Fn(x)的观察值为

      Fn(x)={0,x<x(1)kn,x(k)xx(k+1),k=1,2,,n11,xx(n)

    6. 格里汶科定理:对于任一实数x,当n时,Fn(x)以概率1一致收敛于分布函数F(x),即P(limnsup<x<+|Fn(x)F(x)|=0)=1对于任一实数x,当n充分大时,经验分布函数的任一个观察值Fn(x)与总体分布函数F(x)只有微小的差别,从而在实际上可当作F(x)使用

3. 常用统计量的分布

  1. χ2分布
    1. X1,X2,,Xn是来自总体N(0,1)的一个样本,则称统计量χ2=X12+X22++Xn2服从自由度为nχ2分布,记为χ2χ2
    2. 概率密度函数
      1. χ2(n)=Γ(n2,2)
      2. χ2(n)分布的概率密度为

        f(y)={12n/2Γ(n/2)yn21ey/2,y>00,

        其中

        Γ(n2)=0+exxn21dx

    3. χ2分布的性质
      1. 可加性:设χ12χ2(n1),χ22χ2(n2)并且χ12,χ22相互独立,则χ12+χ22χ2(n1+n2)
      2. 推广到多个随机变量:设χi2χi2(ni),并且相互独立,则i=1mχi2χ2(n1+n2++nm)
      3. χ2χ2,则E(χ2)=n,D(χ2)=2n
    4. χ2分布的分位点
      1. 对于给定的正数α,0<α<1,称满足条件P(χ2>χα2(n))=χα2(n)f(y)dy=α的点χα2(n)χ2(n)分布的上α分位点

      2. 费希尔:当n充分大时,χα2(n)12(zα+2n1)2,其中zα时标准正态分布的上α分位点

  2. t 分布
    1. t 分布:设XN(0,1),Yχ2(n),且X,Y独立,则称随机变量t=XY/n服从自由度为nt分布,记为tt(n)
    2. 概率密度函数:

      h(t)=Γ((n+1)2)πnΓ(n/2)(1+t2n)(n+1)/2, <x<+

    3. t 分布的分位点
      1. 对于给定的α,0<α<1,称满足条件P(t>tα(n))=tα(n)h(t)dt=α的点tα(n)t(n)分布的上α分位点

      2. t1α=tα(n)

  3. F 分布
    1. F 分布:设Uχ2(n1),Vχ2(n2),且U,V相互独立,则称F=U/n1V/n2时服从自由度为(n1,n2)F分布
    2. 如果FF(n1,n2),则1/FF(n2,n1)
    3. F 分布的分位点:对于给定的α,0<α<1,称满足条件P(F>Fα(n1,n2))=Fα(n1,n2)ψ(y)dy=α的点Fα(n1,n2)F(n1,n2)分布的上α分位点

4. 正态总体的样本均值与样本方差的分布

  1. 设总体X的均值为μ, 方差为σ2,X1,X2,,Xn是来自总体X的样本,则总有X¯N(μ,σ2n)

    E(X¯)=μ,D(X¯)=σ2n,E(S2)=σ2

  2. i=1n(XiX¯)2σ2=(n1)S2σ2χ2(n1)
  3. X¯,S2独立
  4. X¯μS/nt(n1)
  5. X1,X2,,Xn1Y1,Y2,,Yn2分别来自正态分布总体N(μ1,σ12),N(μ2,σ22)的样本,而且这两个样本相互独立,两个样本的均值和方差分别是X¯,Y¯,S12,S22,则有
    1. S12/S22σ12/σ22F(n11,n21)
    2. σ1=σ2=σ

      (X¯Y¯)(μ1μ2)Sϖ1n1+1n2t(n1+n22)

      其中Sϖ2=(n11)S12+(n21)S22n1+n22,Sϖ=Sϖ2

__EOF__

本文作者RadiumGalaxy
本文链接https://www.cnblogs.com/RadiumGalaxy/p/16929775.html
关于博主:评论和私信会在第一时间回复。或者直接私信我。
版权声明:本博客所有文章除特别声明外,均采用 BY-NC-SA 许可协议。转载请注明出处!
声援博主:如果您觉得文章对您有帮助,可以点击文章右下角推荐一下。您的鼓励是博主的最大动力!
posted @   RadiumStar  阅读(203)  评论(0编辑  收藏  举报
相关博文:
阅读排行:
· 全程不用写代码,我用AI程序员写了一个飞机大战
· DeepSeek 开源周回顾「GitHub 热点速览」
· 记一次.NET内存居高不下排查解决与启示
· 物流快递公司核心技术能力-地址解析分单基础技术分享
· .NET 10首个预览版发布:重大改进与新特性概览!
点击右上角即可分享
微信分享提示