Typesetting math: 76%

概率论与数理统计期末复习整理

2022-01-16 14:29:35 星期日
2024-01-04 21:05:03 星期四

第一章 随机事件及其概率

样本点:对于随机试验,把每一个可能的结果称为样本点

随机事件:某些样本点的集合

基本事件:单个样本点构成的集合

样本空间(或必然事件):所有样本点构成的集合,记作 Ω

不可能事件:不含任何样本点,记作

事件关系运算

交换律:AB=BA,  AB=BAAB=BA,  AB=BA

结合律:A(BC)=(AB)C, A(BC)=(AB)CA(BC)=(AB)C, A(BC)=(AB)C

分配律:A(BC)=(AB)(AC)A(BC)=(AB)(AC), (AB)C=(AC)(BC)(AB)C=(AC)(BC), A(BC)=ABACA(BC)=ABAC

对偶率¯AB=¯A¯B¯¯¯¯¯¯¯¯¯¯¯¯¯¯AB=¯¯¯¯A¯¯¯¯B, ¯AB=¯A¯B¯¯¯¯¯¯¯¯¯¯¯¯¯¯AB=¯¯¯¯A¯¯¯¯B

事件的积:AB=ABAB=AB

事件的和:ABABA+BABAB−−−−A+B

事件的差:AB=AΩAB=A¯BAB=AΩAB=A¯¯¯¯B

概率性质

  1. 对于任意事件A,0P(A)10P(A)1

  2. P(Ω)=1P()=0P(Ω)=1P()=0

  3. 对于两两互斥的有限多个事件A1 ,A2 ,...,Am A1 ,A2 ,...,Am 

    P(A1 +A2 +...+Am )=P(A1 )+P(A2 )+...+P(Am )P(A1 +A2 +...+Am )=P(A1 )+P(A2 )+...+P(Am )

推论

  1. P(¯A)=1P(A)P(¯¯¯¯A)=1P(A)

  2. 任意时候:P(AB)=P(A)P(AB)P(AB)=P(A)P(AB)

    ABAB , 则 P(AB)=P(A)P(B)P(AB)=P(A)P(B)

  3. P(AB)=P(A)+P(B)P(AB)P(AB)=P(A)+P(B)P(AB)

    因此,P(AB)=P(A)+P(B)P(AB)P(AB)=P(A)+P(B)P(AB)

条件概率 全概率公式 Bayes公式

条件概率

P(A|B)=P(AB)P(B)P(A|B)=P(AB)P(B)

乘法定理 P(AB)=P(B)P(A|B)=P(A)P(B|A)P(AB)=P(B)P(A|B)=P(A)P(B|A)

全概率公式

P(B)=ni=1P(AiB)=ni=1P(Ai)P(B|Ai)P(B)=ni=1P(AiB)=ni=1P(Ai)P(B|Ai)

Bayes公式

P(Ai|B)=P(AiB)P(B)=P(Ai)P(B|Ai)ni=1P(Ai)P(B|Ai)P(Ai|B)=P(AiB)P(B)=P(Ai)P(B|Ai)ni=1P(Ai)P(B|Ai)

事件的独立性

定义:若 P(AB)=P(A)P(B)P(AB)=P(A)P(B), 则A与B是相互独立的

性质:

  1. 必然事件 Ω, 不可能事件 与任何事件独立
  2. ABAB独立,则 AA¯B¯¯¯¯B , ¯AB¯¯¯¯AB¯A¯B¯¯¯¯A¯¯¯¯B也独立

第二章 随机变量及其分布

随机变量定义

随机变量:

(Ω,F,P)(Ω,F,P)是一个概率空间ξ(ω)ξ(ω) 是定义在 ΩΩ 内的一个单值函数,如果对任意实数x,有{ω:ξ(ω)x}F{ω:ξ(ω)x}F , 则称 ξ(ω)ξ(ω)随机变量,记作 ξξ.

可以看到,ξ(ω)ξ(ω)是一个函数,ω为自变量,定义域为 Ω 。

分布函数:

​ 称F(x)=P{ξ(ω)x},<x<+F(x)=P{ξ(ω)x},<x<+ 为随机变量 ξ(ω)ξ(ω) 的分布函数

分布函数性质:

  1. 0F(x)10F(x)1
  2. F(x)F(x)单调不减
  3. F()=limxF(x)=0F()=limxF(x)=0,F(+)=limx+F(x)=1F(+)=limx+F(x)=1
  4. F(x)F(x)是右连续的

几个公式:

P{a<ξ(ω)b}=F(b)F(a)P{a<ξ(ω)b}=F(b)F(a)

P{ξ(ω)<b}=F(b)P{ξ(ω)<b}=F(b)

P{ξ(ω)=b}=F(b)F(b)P{ξ(ω)=b}=F(b)F(b)

P{aξ(ω)<b}=F(b)F(a)P{aξ(ω)<b}=F(b)F(a)

对于连续型随机变量:F(b)=F(b)F(b)=F(b)

离散型随机变量

分布函数:F(x)=xkxP{X=xk}F(x)=xkxP{X=xk}

分布律:P{X=xi}=pi,   (i=1,2,3,...,n,...)P{X=xi}=pi,   (i=1,2,3,...,n,...)

XX x1x1 x2x2 x3x3 ...
pipi p1p1 p2p2 p3p3 ...

常用离散分布

  1. 退化分布 P{X=c}=1P{X=c}=1

  2. 两点分布 P{X=k}=pk(1p)1k   (k=0,1)P{X=k}=pk(1p)1k   (k=0,1)

  3. 均匀分布 P{X=xk}=1n      (k=1,2,3,...,n)P{X=xk}=1n      (k=1,2,3,...,n)

  4. 二项分布

    XB(n,p)XB(n,p), 则 P{X=k}=Cknpk(1p)nkP{X=k}=Cknpk(1p)nk

  5. 泊松分布

    XP(λ)XP(λ), 则 P{X=k}=λkk!eλP{X=k}=λkk!eλ

    【泊松定理】:当n很大,pnpn很小时且λ>0λ>0时,可以用泊松分布近似为 二项分布,其中 λ=limn npnλ=limn npn

连续型随机变量

分布函数与概率密度关系

F(x)=xp(x)dxF(x)=xp(x)dx, 其中 p(x)p(x)为概率密度函数

常用连续分布

  1. 均匀分布 p(x)={1baaxb0p(x)={1baaxb0

  2. 正态分布

    p(x)=12πσe(xμ)22σ2,<x<+p(x)=12πσe(xμ)22σ2,<x<+

    正态分布标准化:Y=XμσY=Xμσ

  3. 指数分布 p(x)={λeλxx00p(x)={λeλxx00,服从指数分布记作 XExp(λ)XExp(λ)

    特点:具有无记忆性

正态分布积分常用的公式:

+et22dt=2π+et22dt=2π

多维随机变量及其分布

由n个随机变量 X1,X2 ,...,Xn X1,X2 ,...,Xn  构成的向量 X=(X1 ,X2 ,...,Xn )X=(X1 ,X2 ,...,Xn )称为nn维随机变量

分布函数:

F(x1,x2,...,xn)=P{X1x1;X2x2;...;Xnxn}F(x1,x2,...,xn)=P{X1x1;X2x2;...;Xnxn}

二维随机变量

对于n=2时,有下面性质

  1. 0F(x,y)10F(x,y)1

  2. F(x,y)F(x,y)关于x和关于y分别是单调非降函数

  3. 记住下面公式

    limxF(x,y)=F(,y)=0limyF(x,y)=F(x,)=0F(+,+)=1limxF(x,y)=F(,y)=0limyF(x,y)=F(x,)=0F(+,+)=1

  4. F(x,y)F(x,y)关于每个变元是右连续的

二维离散型随机变量(X,Y)的分布律:

P{X=xi;Y=yi}=pij      (i,j=1,2,3,...,n)P{X=xi;Y=yi}=pij      (i,j=1,2,3,...,n)

二维连续型随机变量(X, Y)的二元分布函数F(x,y)如下:

F(x,y)=xyp(x,y)dxdyF(x,y)=xyp(x,y)dxdy

其中p(x,y)p(x,y)为联合密度函数

p(x,y)p(x,y)性质:

  1. 非负性:p(x,y)0p(x,y)0

  2. ++p(x,y)dxdy=1++p(x,y)dxdy=1

  3. p(x,y)p(x,y)(x,y)(x,y)处连续:

    2Fxy=p(x,y)2Fxy=p(x,y)

  4. 若D为xOyxOy平面的任一区域,则

    P{(X,Y)D}=Dp(u,v)dudvP{(X,Y)D}=Dp(u,v)dudv

边缘分布

分布函数

FX(x)=P{Xx}=P{Xx;Y<+}=F(x,+)FX(x)=P{Xx}=P{Xx;Y<+}=F(x,+)

FY(y)=P{Yy}=P{X<+; Yy}=F(+,y)FY(y)=P{Yy}=P{X<+; Yy}=F(+,y)

分布律

若为离散型,则

pi=jpijpj=ipijpi=jpijpj=ipij

若为连续型,则

pX(x)=+p(x,y)dypY(y)=+p(x,y)dxpX(x)=+p(x,y)dypY(y)=+p(x,y)dx

随机变量独立性

连续型:p(x,y)=pX(x)pY(y)X,Yp(x,y)=pX(x)pY(y)X,Y

离散型:pij=pi×pjX,Ypij=pi×pjX,Y

条件分布

离散型:

P{X=xi|Y=yj}=pijpjP{Y=yj|X=xi}=pijpiP{X=xi|Y=yj}=pijpjP{Y=yj|X=xi}=pijpi

连续型:

p(x|y)=p(x,y)pY(y)p(x|y)=p(x,y)pY(y)

随机变量的函数及其分布

问题: 若Y=f(X)Y=f(X),如何根据X的分布推导Y的分布?

单个随机变量

Y=f(X)Y=f(X), 已知映射关系ff (如Y=X2)Y=X2) 以及 随机变量 X 的分布律,求Y的分布?

解:先求 FY(y)=P{Yy}FY(y)=P{Yy} 再求导得 pY(y)=dFY(y)dypY(y)=dFY(y)dy

两个随机变量

Z=f(X,Y)Z=f(X,Y) ,则 P{Z=zk}=f(xi,yi)=zkP{X=xi;Y=yi}P{Z=zk}=f(xi,yi)=zkP{X=xi;Y=yi}

一般法:

  1. 先求FZ(z)=P{Zz}=P{f(X,Y)z}=f(x,y)zp(x,y)dxdyFZ(z)=P{Zz}=P{f(X,Y)z}=f(x,y)zp(x,y)dxdy
  2. FZ(z)FZ(z)求导得 fZ(z)=dFZdzfZ(z)=dFZdz

特殊法:

​ 对于 Z=X+Y,Z=XY,Z=X/YZ=X+Y,Z=XY,Z=X/Y几种情况,其概率密度函数可以用下面方式计算:

​ 写出 Z=g(X,Y)Z=g(X,Y)的形式(如Z=X+YZ=X+Y), 则解出Y=h(X,Z)Y=h(X,Z) (如Y=ZXY=ZX),于是fz(z)=+f[x,h(x,z)]×|hz|dxfz(z)=+f[x,h(x,z)]×|hz|dx

第三章 随机变量数字特征

数学期望

离散随机变量: E(X)=n=1xnpnE(X)=n=1xnpn

连续随机变量: E(X)=+xp(x)dxE(X)=+xp(x)dx

注意:有时为了方便,E(X)E(X)也写作EXEX

随机变量函数Y=f(X)的数学期望E(Y):

  • 离散:E(Y)=E[f(X)]=i=1f(xi)piE(Y)=E[f(X)]=i=1f(xi)pi

  • 连续:E(Y)=E[f(X)]=+f(x)p(x)dxE(Y)=E[f(X)]=+f(x)p(x)dx

二维随机变量Z=f(X,Y)Z=f(X,Y),若E(Z)E(Z)存在,求E(Z)E(Z)

  • 离散:E(Z)=i=1j=1f(xi,yj)pijE(Z)=i=1j=1f(xi,yj)pij

  • 连续:E(Z)=++f(x,y)p(x,y)dxdyE(Z)=++f(x,y)p(x,y)dxdy

数学期望性质

  1. E(C)=CE(C)=C, (CC为常数)
  2. E(kX)=kE(X),E(X+Y)=E(X)+E(Y)E(kX)=kE(X),E(X+Y)=E(X)+E(Y) (不需要X、Y独立)
  3. XYE(XY)=E(X)E(Y)XYE(XY)=E(X)E(Y) (注意,不能用该方法证明X、Y是独立的)

方差和矩

方差定义:D(X)=E[XE(X)]2D(X)=E[XE(X)]2,标准差 σX=D(X)σX=D(X)

计算公式

方法一(定义法)

  • 离散场合:D(X)=E[XE(X)]2=i=1(xiE(X))2piD(X)=E[XE(X)]2=i=1(xiE(X))2pi
  • 连续场合:D(X)=E[XE(X)]2=+(xE(X))2p(x)dxD(X)=E[XE(X)]2=+(xE(X))2p(x)dx

方法二

D(X)=E(X2)[E(X)]2D(X)=E(X2)[E(X)]2

方差性质

  1. D(C)=0D(C)=0, CC为常数
  2. D(kX)=k2D(X)D(kX)=k2D(X)
  3. 若X,Y独立,D(X±Y)=D(X)+D(Y)D(X±Y)=D(X)+D(Y)

常用分布的期望和方差

分布 期望E(X) 方差D(X)
二项分布(离散) npnp np(1p)np(1p)
泊松分布(离散) λλ λλ
几何分布(离散) 1/p1/p (1p)/p2(1p)/p2
指数分布(连续) 1/λ1/λ 1/λ21/λ2
均匀分布(连续) (a+b)/2(a+b)/2 (ab)2/12(ab)2/12
正态分布(连续) μμ σ2σ2

对于[正态分布],有 E(X2)=μ2+σ2E(X2)=μ2+σ2

其它分布 E(X2)=D(X)+[E(X)]2E(X2)=D(X)+[E(X)]2

原点矩:k阶原点矩 αk=E(Xk)αk=E(Xk), k=1k=1时即为数学期望E(X)

中心距:k阶中心距 μk=E[XE(X)]kμk=E[XE(X)]k , k=2k=2时即为方差D(X)

协方差与相关系数

协方差

随机变量X与Y的协方差记为 cov(X,Y)cov(X,Y),即

cov(X,Y)=E[(XEX)(YEY)]cov(X,Y)=E[(XEX)(YEY)]

协方差性质:

  1. cov(X,Y)=cov(Y,X)cov(X,Y)=cov(Y,X)
  2. cov(X,Y)=E(XY)E(X)E(Y)cov(X,Y)=E(XY)E(X)E(Y)
  3. cov(aX,bY)=ab×cov(X,Y)cov(aX,bY)=ab×cov(X,Y)
  4. cov(X1+X2,Y)=cov(X1,Y)+cov(X2,Y)cov(X1+X2,Y)=cov(X1,Y)+cov(X2,Y)
  5. XYXY独立,则 cov(X,Y)=0cov(X,Y)=0
  6. D(X±Y)=D(X)+D(Y)±2cov(X,Y)D(X±Y)=D(X)+D(Y)±2cov(X,Y)

相关系数

ρXY=cov(X,Y)σXσYρXY=cov(X,Y)σXσY

其中σX,σYσX,σY 分别为 X,Y的标准差;当 ρXY=0ρXY=0时,则称 X,Y 不相关

性质:

  1. 对于任意随机变量X和Y,均有 |ρXY|1|ρXY|1
  2. ρXY=1P{Y=aX+b}=1ρXY=1P{Y=aX+b}=1,其中a和b均为常数且a0a0
  3. X和Y相互独立 X和Y不相关 (反之不成立,除非X、Y均服从正态分布)

第四章 极限定理

大数定律

大数定律:设{Xn}{Xn}是一个随机变量序列,{an}{an}是一个常数序列,若对任意实数ε>0, 都有

limn+P{1nni=1Xian∣<ε}=1  1nni=1XianP0limn+P{1nni=1Xian<ε}=1  1nni=1XianP0

则称{Xn}{Xn}服从大数定律。


切比雪夫大数定律:

limnP{|1nni=1Xi1nni=1E(Xi)|<ε}=1     1nni=1(XiE(Xi))P0limnP{|1nni=1Xi1nni=1E(Xi)|<ε}=1     1nni=1(XiE(Xi))P0

切比雪夫不等式:

P{|XE(X)|ε}D(X)ε2P{|XE(X)|ε}D(X)ε2


伯努利大数定律:设nAnA为n重伯努律试验中A出现的次数,p为每次试验中A出现的概率,则对任意实数ε>0ε>0,都有

limnP{|nAnp|<ε}=1limnP{|nAnp|<ε}=1

可以理解为,当试验次数n足够大时,A事件发生的频率 nAnnAn 近似等于A事件发生的概率


辛钦大数定律:设随机变量序列{Xn}{Xn}独立同分布,且E(Xi)=μE(Xi)=μ,则对任意实数ε>0ε>0,都有

limnP{|1nni=1Xiμ|<ε}=1limnP{|1nni=1Xiμ|<ε}=1


中心极限定理

林德贝格-列维中心极限定理(独立同分布中心极限定理):

​ 设随机变量序列{Xn}{Xn}独立同分布,且存在数学期望E(Xi)=μE(Xi)=μ和方差D(Xi)=σ2>0D(Xi)=σ2>0,则对于任意xx,有

limnP{ni=1Xinμnσx}=Φ(x)limnP{ni=1Xinμnσx}=Φ(x)

  • 其中 Φ(x)=+12πex22dxΦ(x)=+12πex22dx 为标准正态分布函数

  • 注意观察,可以发现 nμnμ就是 ni=1Xini=1Xi的数学期望,分母 nσnσ就是ni=1Xini=1Xi的标准差(可以与下一个定理进行比较,方便记住公式)

该定理表明,独立同分布序列,只要方差存在且不为0,当n足够大,就有

ni=1XinμnσAN(0,1)ni=1XinμnσAN(0,1)

AN(0,1)AN(0,1)表示近似(almost)标准正态分布, 从而

i=1nXiAN(nμ,nσ2)i=1nXiAN(nμ,nσ2)


棣莫弗-拉普拉斯定理:设随机变量 YnYn ~ B(n,p)n=1,2,...B(n,p)n=1,2,...,对任意xx,有

limnP{Ynnpnp(1p)x}=Φ(x)limnP{Ynnpnp(1p)x}=Φ(x)

(注意与上一个定理的公式对比,方便记忆)


第五章 数理统计基本概念与抽样分布

基本概念

  • 总体:在数理统计中,一个随机变量X或分布函数F(x)F(x)称为一个总体

  • 样本:在一个总体XX中,随机抽取n个个体X1,...,XnX1,...,Xn,称为来自总体X的容量为n的样本,通常记为(X1,...,Xn)(X1,...,Xn)

  • 样本值:在一次抽样观察后,得到的一组数值(X1,...,Xn)(X1,...,Xn),称之为样本(X1,...,Xn)(X1,...,Xn)的观测值,简称为样本值

  • 样本空间:样本(X1,...,Xn)(X1,...,Xn)所有可能取值的全体称为样本空间,记作 ΩΩ

随机抽取的样本应该满足以下两个条件,满足这2个条件的称之为简单随机样本

  1. 代表性
  2. 独立性

样本的分布

(X1,...,Xn)(X1,...,Xn)是来自总体X的一个样本

  1. (X是连续情况)若总体X的分布密度函数为p(x)p(x),则样本的联合分布密度函数为 ni=1p(xi)ni=1p(xi)
  2. (X是离散情况)总体X的分布律为 P{X=xi}=p(xi)P{X=xi}=p(xi),则样本的联合分布律为 ni=1p(xi)ni=1p(xi)
  3. 总体X的分布函数为F(x),则样本的联合分布函数为 ni=1F(xi)ni=1F(xi)

统计量

定义:

  • (X1,...,Xn)(X1,...,Xn)是来自总体X的一个样本,若样本的函数f(X1,X2,...,Xn)f(X1,X2,...,Xn)不含任何未知参数,则称f(X1,X2,...,Xn)f(X1,X2,...,Xn)是一个统计量

  • (x1,x2,...,xn)(x1,x2,...,xn)是一个样本值,则称f(x1,x2,...,xn)f(x1,x2,...,xn)为统计量f(X1,X2,...,Xn)f(X1,X2,...,Xn) 的一个观测值

可以看到,统计量来自总体(是总体的一个样本),不含任何未知参数,完全由样本来确定,也就是说,根据样本可以求出我们需要的任何一个统计量的值。

例如:设样本(X1,...,Xn)(X1,...,Xn)来自正态总体XX~N(μ,σ2)N(μ,σ2),其中μμ已知而σσ未知,则

  1. ni=1Xini=1Xi1nni=1(Xiμ)21nni=1(Xiμ)2 是统计量
  2. 1σ2ni=1(Xiμ)21σ2ni=1(Xiμ)2 不是统计量

常用统计量——样本矩

  1. 样本均值 ¯X=1nni=1Xi¯¯¯¯¯X=1nni=1Xi

  2. 样本方差 S2n=1nni=1(Xi¯X)2=1nni=1X2i¯X2S2n=1nni=1(Xi¯¯¯¯¯X)2=1nni=1X2i¯¯¯¯¯X2

    样本标准差 Sn=S2nSn=S2n

  3. 修正样本方差 S2n=1n1ni=1(Xi¯X)2=nn1S2nS2n=1n1ni=1(Xi¯¯¯¯¯X)2=nn1S2n

    修正样本标准差 Sn=S2nSn=S2n

  4. 样本k阶原点矩 Ak=1nni=1XkiAk=1nni=1Xki

  5. 样本k阶中心矩 Bk=1nni=1(Xi¯X)kBk=1nni=1(Xi¯¯¯¯¯X)k

性质(重要)

  1. E(¯X)=E(X)E(¯¯¯¯¯X)=E(X)
  2. D(¯X)=1nD(X)D(¯¯¯¯¯X)=1nD(X)
  3. E(S2n)=n1nD(X)E(S2n)=n1nD(X)
  4. E(S2n)=D(X)E(S2n)=D(X)

次序统计量(不重要,跳过)

常用统计分布

χχ 分布

定义:设随机变量X1,X2,...,XnX1,X2,...,Xn 独立同分布,且每个 XiN(0,1),  i=1,2,...,nXiN(0,1),  i=1,2,...,n,则称随机变量:

χ2n=ni=1X2iχ2n=ni=1X2i

服从自由度为n的卡方(χ2χ2)分布, 记为 χ2nχ2(n)χ2nχ2(n),随机变量 χ2nχ2n亦被称为 χ2χ2变量

伽马函数(不需要记)

Γ(α)=+0xα1exdx,(α>0)Γ(α)=+0xα1exdx,(α>0)

根据定义得出以下结论

  1. 若总体XN(0,1),  (X1,X2,...,X3)XN(0,1),  (X1,X2,...,X3)是其中一个样本,则统计量 ni=1X2iχ2(n)ni=1X2iχ2(n)
  2. 若总体XN(μ,σ2),  (X1,X2,...,X3)XN(μ,σ2),  (X1,X2,...,X3)是其中一个样本,则统计量 1σ2ni=1(Xiμ)2χ2(n)1σ2ni=1(Xiμ)2χ2(n)

性质一

E(χ2n)=nD(χ2n)=2nE(χ2n)=nD(χ2n)=2n

性质二(可加性)

X1χ2(n1),X2χ2(n2)X1χ2(n1),X2χ2(n2), 且 X1,X2X1,X2相互独立,则

X1+X2χ2(n1+n2)X1+X2χ2(n1+n2)

性质三

χ2nAN(n,2n)χ2nAN(n,2n)

t 分布

定义:设XN(0,1),Yχ2(n)XN(0,1),Yχ2(n), 且X,YX,Y相互独立,则称随机变量

T=XY/nT=XY/n

服从自由度为n的t分布,记为Tt(n)Tt(n),随机变量T也称为t变量

t分布是关于y轴对称的

t分布

当n=1时,p(x)=1π11+x2p(x)=1π11+x2, 为柯西分布

当n充分大时,t分布趋于标准正态分布

性质一

E(T)=0D(T)=nn2E(T)=0D(T)=nn2

性质二

limnp(x)=12πex22limnp(x)=12πex22

即n足够大(n>30即可)时,近似看作服从标准正态分布,记作TAN(0,1)TAN(0,1)

但在n较小时,就与标准正态分布有较大差距,在t分布的尾部比标准正态分布的尾部有更大的概率,即

P{|T|t0}P{|X|t0}P{|T|t0}P{|X|t0}

F 分布

定义:设 Xχ2(n1),Yχ2(n2)Xχ2(n1),Yχ2(n2), 且X与Y相互独立,则称随机变量 F=X/n1Y/n2F=X/n1Y/n2服从自由度为(n1,n2)(n1,n2)的F分布,记为FF(n1,n2)FF(n1,n2),其中n1n1称为第一自由度,n2n2称为第二自由度。



性质一,设 FF(n1,n2)FF(n1,n2), 则

1FF(n2,n1)1FF(n2,n1)

性质二,设 Tt(n)Tt(n), 则

T2F(1,n)T2F(1,n)

概率分布的分位数

定义:设总体X和给定的 α(0<α<1)α(0<α<1),若存在 xαxα,使得

P{X>xα}=αP{X>xα}=α

则称xαxα为此概率分布的上α分位点(或称临界值),称x12x12为此概率分布的中位数。

标准正态分布的α分位点

Φ(uα)=1αΦ(uα)=1α

根据标准正态分布的y轴对称性:uα=u1αuα=u1α

χ2χ2分布的α分位点

定义:P{χ2n>χ2α(n)}=αP{χ2n>χ2α(n)}=α

t分布的α分位点

定义:P{T>tα(n)}=αP{T>tα(n)}=α

根据t分布的y轴对称性,有 tα(n)=t1α(n)tα(n)=t1α(n)

当n较大时,有 tα=uαtα=uα

F分布的α分位点

定义:P{F>Fα(n1,n2)}=αP{F>Fα(n1,n2)}=α

性质:

Fα(n1,n2)=1F1α(n2,n1)Fα(n1,n2)=1F1α(n2,n1)

抽样分布(重要)

定理5.3

设总体XN(μ,σ2),(X1,X2,...,Xn)XN(μ,σ2),(X1,X2,...,Xn)是来自总体X的一个样本,则有:

  1. ¯XN(μ,σ2n)¯¯¯¯¯XN(μ,σ2n)¯Xμσ/nN(0,1)¯¯¯¯¯Xμσ/nN(0,1)
  2. ¯X¯¯¯¯¯XS2nS2nS2nS2n相互独立
  3. (n1)S2nσ2χ2(n1)(n1)S2nσ2χ2(n1)nS2nσ2χ2(n1)nS2nσ2χ2(n1)
  4. ¯XμSn/nt(n1)¯¯¯¯¯XμSn/nt(n1)¯XμSn/n1t(n1)¯¯¯¯¯XμSn/n1t(n1)

定理5.4

X1,X2,,Xn1X1,X2,,Xn1Y1,Y2,,Yn2Y1,Y2,,Yn2分别是来自正态总体 N(μ1,σ21)N(μ1,σ21)N(μ2,σ22)N(μ2,σ22)的样本,且这两个样本相互独立,设 ¯X,¯Y¯¯¯¯¯X,¯¯¯¯Y分别是两个样本的均值,且 S2n1,S2n2S2n1,S2n2分别是这两个样本的修正样本方差,则有:

  1. S2n1/S2n2σ21/σ22F(n11,n21)S2n1/S2n2σ21/σ22F(n11,n21)
  2. σ21=σ22=σ2σ21=σ22=σ2时,有

    (¯X¯Y)(μ1μ2)Sw1n1+1n2t(n1+n22)(¯¯¯¯¯X¯¯¯¯Y)(μ1μ2)Sw1n1+1n2t(n1+n22)

    其中

    Sw=(n11)S2n1+(n21)S2n2n1+n22Sw=(n11)S2n1+(n21)S2n2n1+n22

第六章 参数估计

参数的点估计

矩估计法

由样本矩的性质知, 样本矩依概率收敛于相应的样本总体,即

Ak=1nni=1XkiPE(Xk)Ak=1nni=1XkiPE(Xk)

Bk=1nni=1(Xi¯X)kPE(XEX)kBk=1nni=1(Xi¯¯¯¯¯X)kPE(XEX)k

矩估计的基本思想是利用样本矩来估计总体矩获得参数的估计量(因为样本足够大时,样本矩与总体矩之间的差距可任意小),基本步骤如下:

  1. 计算【总体X】从1阶矩到m阶矩(m为未知参数的个数):E(X),E(X2),,E(Xm)E(X),E(X2),,E(Xm)
  2. 计算【样本】的矩:A1,A2,,AmA1,A2,,Am
  3. 解方程组

    {A1=E(X)A2=E(X2)Am=E(Xm)⎪ ⎪ ⎪⎪ ⎪ ⎪A1=E(X)A2=E(X2)Am=E(Xm)

    得到未知参数 θi  θi 的估计值

    {ˆθ1=ˆθ1(X1,X2,,Xn)ˆθ2=ˆθ2(X1,X2,,Xn)ˆθm=ˆθm(X1,X2,,Xn)⎪ ⎪ ⎪ ⎪⎪ ⎪ ⎪ ⎪^θ1=^θ1(X1,X2,,Xn)^θ2=^θ2(X1,X2,,Xn)^θm=^θm(X1,X2,,Xn)

注意:对于样本来说,样本的所有参量认为是已知的,而总体的参量是我们需要估计的,因此,根据样本依概率矩收敛于总体矩的特性知:可以通过样本来估计总体的参量。

例如:样本的均值¯X¯¯¯¯¯X和方差S2nS2n总是总体的数学期望E(X)E(X)和方差D(X)D(X)的矩估计量。

最大似然估计法

前提:总体的分布形式已知,如已知p(x;θ),θp(x;θ),θ为未知参数

似然函数:样本的联合分布律 L(θ)=ni=1p(xi;θ)L(θ)=ni=1p(xi;θ)

基本思想:在试验中概率最大(即L(θ)L(θ))的事件最有可能出现,我们就是要找到这样一个参数 θ 使得其发生的概率最大。

求解步骤:

  1. 求似然函数:L(θ)=ni=1p(xi;θ)
  2. L(θ)最大值,一般通过求导使得 lnL(θ)θθ=ˆθ=0(该方程称为似然方程), 有多个参数就分别对该参数求偏导
  3. 求解第二步的方程,得到参数的估计值θi=^θi

注意:若无法通过求导方式求解似然函数L(θ)最大值,可以通过分析L(θ)单调特性,以及θ可能取值范围,从 θ取值范围中选择一个值使得L(θ)取得最大值,最后用该值作为该参数的估计值

估计量的优良性评判

既然是估计量,那与真实值之间就存在误差,因此需要判断估计量是否满足我们的要求,可以通过下面的几个准则来进行评判。

无偏性

定义:设(X1,X2,,Xn)是来自总体X的一个样本,θΘ 为总体分布中的未知参数,ˆθ=ˆθ(X1,X2,,Xn)θ 的一个估计量,若对任意 θΘ,有

E(ˆθ)=θ

ˆθθ 的无偏估计(量).

  • 估计量的偏差:bn=E[ˆθ(X1,X2,,Xn)]θ

  • 有偏估计量:当 bn0 时,称 ˆθθ 的有偏估计(量)

  • 渐进无偏估计量:若limnbn=0, 则称 ˆθθ 的渐进无偏估计(量)

有效性

定义:设 ˆθ1=ˆθ1(X1,X2,,Xn)ˆθ2=ˆθ2(X1,X2,,Xn) 均为参数 θ 的无偏估计量,若

D(ˆθ1)<D(ˆθ2)

则称 ˆθ1ˆθ2 有效

在多个无偏估计量中,方差最小(最有效)那个被称为最小方差无偏估计量

相合性(一致性)

一个优良的估计量,不仅是无偏的,且具有较小的方差,还希望当样本容量n增大时,估计量能在某种意义下收敛于被估计的参数,这就是 相合性(或一致性)

定义:设 ˆθn=ˆθn(X1,X2,,Xn)是参数 θ 的估计量,如果当 n 增大时,ˆθn 依概率收敛于 θ ,即对任意 ε>0 ,有

limnP{|ˆθnθ|<ε}=1limnP{|ˆθnθ|ε}=0

则称 ˆθnθ 的相合估计(量),或一致估计(量)

定理:设 ˆθn=ˆθn(X1,X2,,Xn)是参数 θ 的一个估计量,若

limnE(ˆθn)=θlimnD(ˆθn)=0

ˆθnθ 的相合估计(量),或一致估计(量)

参数的区间估计

定义:设总体X的分布函数为 F(x;θ),θ是未知参数,(X1,X2,,Xn)是来自总体X的一个样本。对于给定的 α(0<α<1),确定两个统计量 ˆθ1=ˆθ1(X1,X2,,Xn)ˆθ2=ˆθ2(X1,X2,,Xn),使得

P{ˆθ1<θ<ˆθ2}=1α

则称随机区间 (ˆθ1,ˆθ2) 为参数 θ置信度1α置信区间

  1. 置信下限:ˆθ1
  2. 置信上限:ˆθ2
  3. 置信度(置信水平):1α

如果置信区间只有一边,如:

P{ˆθ1<θ}=1α  P{θ<ˆθ2}=1α

则称置信区间 (ˆθ1,+)(,ˆθ2)单侧置信区间

求置信区间步骤

  1. 确定统计量 W
  2. 给定置信度1α,写出下面的式子

    P{a<W<b},  a=x1α2,b=xα2

    x1α2xα2 分别为对应分布上的 1α2α2 分位点。可以看出,给定置信度1α是用来确定 x1α2xα2的值的
  3. 上面已经求出a, b的值,所以只需要解出下面的不等式即可得出参数区间(ˆθ1,^θ2)

    a<W<b

不同分布在不同情况下应取什么统计量,参考下表

第七章 假设检验

基本原理

假设检验的基本原理:给定一个假设H0,为了检验H0是否正确,首先假定H0是正确的,然后根据抽取到的样本来判断是接收还是拒绝该假设。如果样本中出现了不合理的观测值,应该拒绝H0,否则应该接受假设H0

“不合理”指的是小概率事件发生,常用 α 来表示这个小概率,α也被称为检验的显著性水平

拒绝域与临界值

拒绝域 and 接受域:设Ω 是所有样本观测值 x=(x1,x2,,xn) 的集合,令

W={x|xΩ使H0}

此集合为 H0拒绝域,其余集 ¯W 称为 H0接受域

从某种意义上说,设计一个检验,本质上就是找到一个恰当的拒绝域W,使得当 H0成立时

P{xW|H0}=α

后面我们常把“小概率事件”视为与拒绝域W是等价的

两类错误

I类错误(弃真错误):假设H0经过检验后是真的,但根据一次抽样结果拒绝了 H0,叫做犯了第I类错误;

II类错误(纳伪错误):假设H0经过检验后是假的,但根据一次抽样结果接受了 H0,叫做犯了第II类错误。

通常只规定 α 的取值,即控制犯第I类错误的概率,而使犯第二类错误的概率尽可能小,要使两者犯错的概率都小,就必须增大样本容量。

假设检验的基本步骤

  1. 根据实际问题的要求,提出原假设 H0 和备选假设 H1,通常 H1H0 区间互补(做题时这一步由题目给出)
  2. 构造统计量 T
  3. 给定显著性水平 α (题目给出),确定拒绝域
  4. 计算观察值 t0
  5. 作出判断:若 t0W,则拒绝H0,接受 H1;反之接受 H0,拒绝 H1

根据不同情形选择不同统计量,参考下表:

posted @   aJream  阅读(1218)  评论(0编辑  收藏  举报
相关博文:
阅读排行:
· 全程不用写代码,我用AI程序员写了一个飞机大战
· DeepSeek 开源周回顾「GitHub 热点速览」
· 记一次.NET内存居高不下排查解决与启示
· MongoDB 8.0这个新功能碉堡了,比商业数据库还牛
· .NET10 - 预览版1新功能体验(一)
点击右上角即可分享
微信分享提示