CSS Ribbon

Reproducing the GitHub Ribbon in CSS

【统计学】6.统计量及其抽样分布

【统计学】6.统计量及其抽样分布

6.1 统计量
6.2 抽样分布
6.3 样本均值的分布与中心极限定理
6.4 由正态分布导出的几个重要分布

学习目标

1.了解统计量及其分布的几个概念
2.了解由正态分布导出的几个重要分布
3.理解样本均值的分布与中心极限定理
4.掌握单样本比例和样本方差的抽样分布

6.1 统计量

6.1.1 统计量的概念

统计量(statistic)

X1,X2,...,Xn

是从总体X中抽取的容量为n的一个样本,如果由次样本构造一个函数

T(X1,X2,...,Xn)

不依赖于任何未知参数,则称函数

T(X1,X2,...,Xn)

是一个统计量

样本均值、样本比例、样本方差等都是统计量

  1. 统计量是样本的一个函数
  2. 统计量是统计推断的基础
6.1.2 常用统计量

(1)样本均值

X¯=1ni=1nXi

(2)样本方差

S2=1n1i=1n(XiX¯)2

(3)样本变异系数

V=SX

(4)k阶矩

mk=1ni=1nXik

(5)k阶中心矩

vk=1n1i=1n(XiX¯)k

(6)样本偏度

α3=n1i=1n(XiX¯)3i=1n(XiX¯)32

(7)样本峰度

α4=n1i=1n(XiX¯)4[i=1n(XiX¯)2]23

6.2 抽样分布(sampling distribution)

  1. 样本统计量的概率分布,是一种理论分布
    1. 在重复选取容量为n的样本时,由该统计量的所有可能取值形成的相对频数分布
  2. 随机变量是样本统计量
    1. 样本均值、样本比例、样本方差等
  3. 结果来自容量相同的所有可能样本
  4. 提供了样本统计量长远而稳定的信息,是进行推断的理论基础,也是抽样推断科学性的重要依据

6.3 样本均值的分布与中心极限定理

样本均值的抽样分布

  1. 在重复容量为n的样本时,由样本均值的多有可能取值形成的相对频数分布
  2. 一种概率分布
  3. 推断总体均值μ的理论基础

当总体服从正态分布

N(μ,σ2)

来自该总体的所有容量为n的样本的均值

x¯

也服从正态分布,

x¯

的数学期望为

μ

方差为

σ2n

x¯N(μ,σ2n)

中心极限定理(central limit theorem)

【统计学】中心极限定理

从均值为μ,方差为

σ2

的任意一个总体中抽取容量为n的样本,当n充分大时,样本均值的抽样分布近似服从均值为μ,方差为

σ2n

的正态分布

【统计学】中心极限定理趋向分布

6.4 由正态分布推导出来的几个重要分布

卡方分布
  1. 有阿贝(Abbe)于1863年首先给出,后来由海尔墨特(Hermert)和卡·皮尔逊(K·Person)分别于1875年和1900年推导出来

  2. XN(μ,σ2)

    z=XμσN(0,1)

  3. Y=z2

    则Y服从自由度为1的卡方分布,即

    Yχ2(1)

  4. 当总体

    XN(μ,σ2)

    从中抽取容量为n的样本,则

    i=12(xix¯)2σ2χ2(n1)

卡方分布的性质和特点

  1. 分布的变量始终为正
  2. 分布的形状取决于其自由度n的大小,通常为不对称的正偏分布,但随着自由度的增大逐渐趋于对称
  3. 期望为

E(χ2)=n

方差为

D(χ2)=2n

其中n为自由度

  1. 可加性:若U和v为两个独立的卡方分布随机变量,

Uχ2(n1),Vχ2(n2)

U+V

这一随机变量服从自由度为

n1+n2

的卡方分布

【统计学】卡方分布

t分布
  1. 高赛特(W.S.Gosset)于1908年在一篇以"student"为笔名的论文中首次提出
  2. t 分布式类似正态分布的一种对称分布,它通常要比正态分布平坦和分散
  3. 一个特定的分布依赖于称之为自由度的参数。随着自由度的增大,分布也逐渐趋于正态分布

【统计学】t分布

F分布
  1. 由统计学家费希尔(R.A.Fisher)提出的,以其姓氏的第一个字母来命名

  2. 设若U为服从自由度为n1的卡方分布,即

    Uχ2(n1)

    V为服从自由度为n2的卡方分布,即

    Vχ2(n2)

    且U和V相互独立,则称F为服从自由度n1和n2的F分布,记为

    F=Un1Vn2

    FF(n1,n2)

    【统计学】F分布

例题

例题 1

设从一个均值μ=10,标准差sigma=0.6的总体中随机选取容量n=36的样本。假定该总体不是很偏,要求:

  1. 样本均值小于9.9的近似概率

    n=36说明是大样本,则该样本均值是满足

    x¯N(10,0.6236)=N(μ,σ2)μ=10,σ=0.1

    先进行标准化

    P(x¯<9.9)=P(x¯100.1<9.9100.1)ϕ(1)=1ϕ(1)=10.8413=0.1587

  2. 样本均值超过9.9的近似概率

P(x¯>9.9)=P(Z>1)=ϕ(1)=0.8413

  1. 样本均值在总体均值10附近0.1范围的概率

P(9.9<x¯<10.1)=P(1<Z<1)=2ϕ(1)1=0.6826

例题2

某汽车电瓶生产商称其生产的电瓶均有均值为60个月,标准差为6个月的寿命分布。现假设质检部门决定检验该厂的说法是否正确,为此随机抽取了50个该厂生产的电瓶进行寿命试验

  1. 假定厂方声称是正确的,试描述50个电瓶的平均寿命的抽样分布

    X¯N(60,3650)

  2. 假定厂方声称是正确的,试描述50个样本组成的样本的平均寿命不超过57个月的概率

P(X¯57)=P(X¯600.7257600.72)=1ϕ(3.529)=10.9998=0.0002

例题3

Z1,Z2,...Z6

表示从标准正态总体中随机抽取的容量为n=6的一个样本,试确定常数b,使得,

P(i=16Zi2b)=0.95

这是一个小样本,总体服从正态分布则

ZiN(0,1)

P(χ62b)=0.95P(χ62>b)=0.05b=12.592

posted on   pandaboy1123  阅读(1312)  评论(0编辑  收藏  举报

编辑推荐:
· 浏览器原生「磁吸」效果!Anchor Positioning 锚点定位神器解析
· 没有源码,如何修改代码逻辑?
· 一个奇形怪状的面试题:Bean中的CHM要不要加volatile?
· [.NET]调用本地 Deepseek 模型
· 一个费力不讨好的项目,让我损失了近一半的绩效!
阅读排行:
· 没有源码,如何修改代码逻辑?
· PowerShell开发游戏 · 打蜜蜂
· 在鹅厂做java开发是什么体验
· 百万级群聊的设计实践
· WPF到Web的无缝过渡:英雄联盟客户端的OpenSilver迁移实战
历史上的今天:
2018-05-12 Day73-CMDB(资产管理采集)的三种实现方式
< 2025年2月 >
26 27 28 29 30 31 1
2 3 4 5 6 7 8
9 10 11 12 13 14 15
16 17 18 19 20 21 22
23 24 25 26 27 28 1
2 3 4 5 6 7 8

导航

统计

点击右上角即可分享
微信分享提示