Typesetting math: 100%

信息学中的概率统计

概率

离散型随机变量常见分布

(1)01 分布

P(X=k)=pk(1p)1kP(X=k)=pk(1p)1k

E(X)=pE(X)=p

D(X)=p(1p)D(X)=p(1p)

(2)二项分布

记作 ​XB(n,p)XB(n,p)

P(X=k)=(nk)pk(1p)nkP(X=k)=(nk)pk(1p)nk

E(X)=npE(X)=np

D(X)=np(1p)D(X)=np(1p)

(3)几何分布

称 ​XX​ 为服从参数为 ​pp​ 的几何分布

P(X=k)=(1p)k1pP(X=k)=(1p)k1p

E(X)=1pE(X)=1p

D(X)=1pp2D(X)=1pp2

(4)Pascal分布(负二项分布)

P(X=k)=(k1r1)pr(1p)krP(X=k)=(k1r1)pr(1p)kr

组合意义是 ​XX​ 是第 ​rr​ 次事件 ​AA​ 发生的时刻

(5)超几何分布

设一批产品数为 ​NN​,次品 ​MM​ 个,不放回抽样 ​nn​ 个,其中次品数为随机变量 ​XX

P(X=k)=(Mk)(Nmnk)(Nn)P(X=k)=(Mk)(Nmnk)(Nn)

(6)泊松分布

P(X=k)=eλλkk!P(X=k)=eλλkk!

记作 ​Xπ(λ)Xπ(λ)​ 或 ​P(λ)P(λ)

E(X)=D(X)=λE(X)=D(X)=λ

泊松定理

设 ​XB(n,pn),n=1,2,XB(n,pn),n=1,2,

又设 ​npnλ>0npnλ>0​,则对固定的 ​kk

limn+(nk)pk(1p)nk=eλλkk!limn+(nk)pk(1p)nk=eλλkk!

连续型随机变量常见分布

如没有特殊说明,​f(x)f(x)​ 是概率密度函数,​F(x)F(x)​ 是概率分布函数

(1)均匀分布

f(x)=1ba,(a<x<b)f(x)=1ba,(a<x<b)

记作 ​XU(a,b)XU(a,b)

E(X)=a+b2E(X)=a+b2

D(X)=(ba)212D(X)=(ba)212

(2)指数分布

f(x)=λeλx,x0f(x)=λeλx,x0

F(x)=1eλx,x0F(x)=1eλx,x0

记作 ​XE(λ)XE(λ)

对于任意 ​0<a<b0<a<b​,​P(a<X<b)=eλaeλbP(a<X<b)=eλaeλb

E(X)=1λE(X)=1λ

D(X)=1λ2D(X)=1λ2

(3)正态分布

f(x)=12πσe(xμ)22σ2f(x)=12πσe(xμ)22σ2

记作 ​XN(μ,σ2)XN(μ,σ2)

E(X)=μE(X)=μ

D(X)=σ2D(X)=σ2

正态分布相加还是正态分布,即 XN(μ1,σ21)XN(μ1,σ21)YN(μ2,σ22)YN(μ2,σ22),且 X,YX,Y 独立,则 X±YN(μ1±μ2,σ21+σ22)X±YN(μ1±μ2,σ21+σ22)

(4)​ΓΓ​分布

f(x)=βαΓ(α)xα1eβx,x>0f(x)=βαΓ(α)xα1eβx,x>0

记作 ​XΓ(α,β)XΓ(α,β)​,其中

Γ(α)=+0xα1exdxΓ(α)=+0xα1exdx

当 ​α=1α=1​ 时,​Γ(α,β)Γ(α,β)​ 退化为 ​E(β)E(β)

当 ​α=n2,β=12α=n2,β=12​ 时,​Γ(α,β)Γ(α,β)​ 退化为自由度为 ​nn​ 的 ​χ2χ2​ 分布,记作 ​Xχ2(n)Xχ2(n)​,即 ​Γ(n2,12)=χ2(n)Γ(n2,12)=χ2(n)

E(X)=αβE(X)=αβ

D(X)=αβ2D(X)=αβ2

性质

(i)​Γ(α+1)=αΓ(α)Γ(α+1)=αΓ(α)

(ii)对于任意正整数,​Γ(n+1)=n!Γ(n+1)=n!

(iii)​Γ(12)=π12Γ(12)=π12

验证

+0f(x)dx=1Γ(α)+0(βx)α1eβxdβx=1+0f(x)dx=1Γ(α)+0(βx)α1eβxdβx=1

联合密度

雅可比行列式

已知 ​X,YX,Y​ 的联合密度 ​fXY(x,y)fXY(x,y)​,设 ​Z=g(X,Y),U=r(X,Y)Z=g(X,Y),U=r(X,Y)​,存在唯一的反函数 ​X=h(Z,U),Y=s(Z,U)X=h(Z,U),Y=s(Z,U)​,且 ​h,sh,s​ 有连续的偏导数,记

J(z,u)=|hzhuszsu|J(z,u)=∣ ∣hzhuszsu∣ ∣

那么 ​fZU(z,u)=fXY(h(z,u),s(z,u))|J(z,u)|fZU(z,u)=fXY(h(z,u),s(z,u))|J(z,u)|​,注意是取绝对值

期望方差相关

期望性质

E(X+Y)=E(X)+E(Y)E(X+Y)=E(X)+E(Y)

X,YX,Y​ 独立 ​E(XY)=E(X)E(Y)E(XY)=E(X)E(Y)​,逆命题不真

E(XY)2E(X2)E(Y2)E(XY)2E(X2)E(Y2)​,许瓦尔兹(Schwarz)不等式

许瓦尔兹(Schwarz)不等式证明

λ,E((λX+Y)2)=λ2E(X2)+2λE(XY)+E(Y2)0Δ0E(XY)2E(X2)E(Y2)λ,E((λX+Y)2)=λ2E(X2)+2λE(XY)+E(Y2)0Δ0E(XY)2E(X2)E(Y2)

方差性质

D(aX+b)=a2D(X)D(aX+b)=a2D(X)

D(X±Y)=D(X)+D(Y)±2E((XE(X))(YE(Y)))D(X±Y)=D(X)+D(Y)±2E((XE(X))(YE(Y)))

若 ​XX​ 和 ​YY​ 独立,则 ​D(X±Y)=D(X)+D(Y)D(X±Y)=D(X)+D(Y)​,反之不成立,于是有若 ​X1,,XnX1,,Xn​ 独立,​D(aiXi+b)=a2iD(Xi)D(aiXi+b)=a2iD(Xi)​。

对于任意常数 ​CC​,​D(X)E(XC)2D(X)E(XC)2​,取等当且仅当 ​C=E(X)C=E(X)

协方差性质

若 ​E((XE(X))(YE(Y)))E((XE(X))(YE(Y)))​ 存在,称为 ​XX​ 和 ​YY​ 的协方差,记作 ​cov(X,Y)cov(X,Y)

cov(X,Y)=cov(Y,X)=E(XY)E(X)E(Y)cov(X,Y)=cov(Y,X)=E(XY)E(X)E(Y)

cov(X,X)=D(X)cov(X,X)=D(X)

cov(a1X+b1,a2X+b2)=a1a2cov(X,Y)cov(a1X+b1,a2X+b2)=a1a2cov(X,Y)

cov(X+Y,Z)=cov(X,Z)+cov(Y,Z)cov(X+Y,Z)=cov(X,Z)+cov(Y,Z)

cov(X,Y)2D(X)D(Y)cov(X,Y)2D(X)D(Y)​,证明:展开后使用期望的最后一条性质——许瓦尔兹(Schwarz)不等式

相关系数性质

定义 ​ρ(X,Y)=cov(X,Y)D(X)D(Y)ρ(X,Y)=cov(X,Y)D(X)D(Y)​ 为 ​XX​ 和 ​YY​ 的相关系数,即 ​ρ(X,Y)=cov(X,Y)ρ(X,Y)=cov(X,Y)​,即将 ​XX​ 和 ​YY​ 标准化之后的协方差

ρ(X,Y)=0cov(X,Y)=0E(XY)=E(X)E(Y)D(X±Y)=D(X)+D(Y)ρ(X,Y)=0cov(X,Y)=0E(XY)=E(X)E(Y)D(X±Y)=D(X)+D(Y)​,但并不能说明独立,除非是 ​XX​ 和 ​YY​ 服从二维正态分布

协方差矩阵

设 ​nn​ 维随机变量 ​(X1,X2,,Xn)(X1,X2,,Xn)​,记 ​σi,j=cov(Xi,Xj)σi,j=cov(Xi,Xj)​,若 ​σi,jσi,j​ 都存在,则称

Σ(X1,X2,,Xn)=(σi,j)Σ(X1,X2,,Xn)=(σi,j)

为 ​(X1,X2,,Xn)(X1,X2,,Xn)​ 的协方差矩阵

(i)非负定

(ii)​σi,i=D(Xi)σi,i=D(Xi)

(iii)​σ2i,jσi,iσj,jσ2i,jσi,iσj,j​(协方差最后的一个性质)

协方差向量表示

X=(X1,X2,,Xn)T,E(X)=(EX1,EX2,,EXn)TX=(X1,X2,,Xn)T,E(X)=(EX1,EX2,,EXn)T

那么 ​Σ(X)=E((XEX)(XEX)T)Σ(X)=E((XEX)(XEX)T)

𝐧n​ 维正态分布的向量表示

对于 ​nn​ 维正态随机变量 ​(X1,X2,,Xn)(X1,X2,,Xn)​,其分布可表示为 ​(X1,X2,,Xn)N(μ,Σ)(X1,X2,,Xn)N(μ,Σ)​,其中 ​μ=(μ1,μ2,,μn)μ=(μ1,μ2,,μn)​ 是 ​nn​ 维期望向量,​ΣΣ​ 是协方差矩阵

记 ​x=(x1,x2,,xn)x=(x1,x2,,xn)​,那么

f(x1,x2,,xn)=1(2π)n2|Σ|12e12(xμ)TΣ1(xμ)f(x1,x2,,xn)=1(2π)n2|Σ|12e12(xμ)TΣ1(xμ)

线性变换下的协方差(矩阵)

设 ​Y=AXY=AX​,​AA​ 是非退化的 ​nn​ 阶矩阵

Σ(Y)=E((YEY)(YEY)T)=E(A(XEX)(XEX)TAT)=AΣ(X)ATΣ(Y)=E((YEY)(YEY)T)=E(A(XEX)(XEX)TAT)=AΣ(X)AT

概率极限理论

随机变量序列的收敛性

对于概率空间 (Ω,F,P)(Ω,F,P) 上的随机变量序列 {Xn}{Xn} 和随机变量 XX

(1)概率为 ​𝟏1​ 地收敛于 ​𝐗X

如果 ​P(limnXn=X)=1P(limnXn=X)=1​,则称 {Xn}{Xn} 概率为 11 的收敛于 XX

记作 ​limnXna.e=XlimnXna.e=X​ 或 ​Xna.eXXna.eX

另一种说法:令 A={ωlimnXn(ω)=X(ω)}A={ωlimnXn(ω)=X(ω)} 是一个随机事件,则 limnXna.e=XP(A)=1limnXna.e=XP(A)=1

(2)依概率收敛于 XX

如果 ε>0,limnP(|XnX|<ε)=1ε>0,limnP(|XnX|<ε)=1,则称 {Xn}{Xn} 依概率收敛于 XX

记作 limnXnP=XlimnXnP=XXnPXXnPX

另一种说法:An,ε={ω|Xn(ω)X(ω)|<ε}An,ε={ω|Xn(ω)X(ω)|<ε},则 limnP=Xε>0,limnP(An,ε)=1limnP=Xε>0,limnP(An,ε)=1

(3)依分布收敛

{Xn}{Xn} 相应分布函数序列收敛

记作 limnXnd=XlimnXnd=XXndXXndX

大数定律

重要不等式

设非负随机变量 XX 的期望 E(X)E(X) 存在,则对于任意实数 ε>0ε>0,有

P(Xε)E(X)εP(Xε)E(X)ε

证明:设 A={ωX(ω)ε}A={ωX(ω)ε},构造 IA(ω)=[ωA]IA(ω)=[ωA],显然有 εIA(ω)X(ω)εIA(ω)X(ω),于是 E(εIA)E(X)E(εIA)E(X),又有 E(εIA)=εE(IA)=εP(A)E(εIA)=εE(IA)=εP(A),因此 P(Xε)E(X)εP(Xε)E(X)ε

推论1:马尔可夫不等式

E(|X|k)E(|X|k) 存在,有

P(|X|ε)E(|X|k)εkP(|X|ε)E(|X|k)εk

推论2:切比雪夫不等式

D(X)D(X) 存在,有

P(|XEX|ε)D(X)ε2P(|XEX|ε)D(X)ε2

大数定律定义

对于随机变量序列 {Xk}{Xk},每个 E(Xk)E(Xk) 都存在,记 ¯Xn=1nnk=1Xk¯¯¯¯¯Xn=1nnk=1Xk

n+n+¯XnE(¯Xn)P0¯¯¯¯¯XnE(¯¯¯¯¯Xn)P0,则称 {Xk}{Xk} 服从大数定律

伯努利大数定律

{Xk=第 k 次实验(0-1分布)}{Xk= k (0-1)} 服从大数定律

证明:设 nA=nk=1XknA=nk=1Xk,于是 ¯Xn=nAn¯¯¯¯¯Xn=nAnε>0ε>0P(¯XnE(¯Xn))εD(¯Xn)ε2=p(1p)nε20(n)P(¯¯¯¯¯XnE(¯¯¯¯¯Xn))εD(¯¯¯¯¯Xn)ε2=p(1p)nε20(n)

切比雪夫大数定律

X1,X2,,XnX1,X2,,Xn 独立,且具有相同的数学期望 μμ 和方差 σ2σ2

{X1,X2,,Xn}{X1,X2,,Xn} 服从大数定律

证明:和伯努利大叔定律的证明类似

扩展结论1

如果 XkXk 互相独立,但不具有相同的数学期望的方差时,可设 E(Xk)=μk,D(Xk)=σ2kσ2E(Xk)=μk,D(Xk)=σ2kσ2

ε>0,limnP(|¯Xn1nnk=1μk|ε)=0ε>0,limnP(|¯¯¯¯¯Xn1nnk=1μk|ε)=0

扩展结论2

可以去掉 XkXk 相互独立,代之以 1n2D(nk=1Xk)n01n2D(nk=1Xk)n0

辛钦大数定律

如果 XkXk 独立同分布,期望存在,则 {X1,X2,,Xk}{X1,X2,,Xk} 满足大数定律

强大数定律

在大数定律的基础上,如果是概率为 11 的收敛,那么服从强大数定律

伯努利、辛钦都是强大数定律,切比雪夫要加入条件 k=1D(Xn)n2k=1D(Xn)n2 收敛才是强大数定律

中心极限定理

对于随机变量序列 {Xk}{Xk},如果 nk=1Xknk=1Xk 的标准化变量依分布收敛到正态分布,则称 {Xk}{Xk} 服从中心极限定理

独立同分布极限定理

XkXk 独立同分布,期望和方差都存在,那么序列服从中心极限定理

统计

常用统计量

¯X=1nni=1Xi¯¯¯¯¯X=1nni=1Xi 为样本均值

S2=1n1ni=1(Xi¯X)2S2=1n1ni=1(Xi¯¯¯¯¯X)2 为样本方差

Ak=1nni=1XkiAk=1nni=1Xki 为样本 kk 阶原点矩

Bk=1nni=1(Xi¯X)kBk=1nni=1(Xi¯¯¯¯¯X)k 为样本 kk 阶中心矩

来自正态总体的常用统计量及其分布

(1) ​χ2χ2​ 分布

X1,X2,,XnX1,X2,,Xn 服从标准正态分布 N(0,1)N(0,1)

则统计量 χ2=ni=1X2iχ2(n)χ2=ni=1X2iχ2(n)

f(x)=12n2Γ(n2)ex2xn21f(x)=12n2Γ(n2)ex2xn21x>0x>0

性质

(i) E(χ2(n))=n,D(χ2(n))=2nE(χ2(n))=n,D(χ2(n))=2n

(ii)若 X1χ2(n1),X2χ2(n2)X1χ2(n1),X2χ2(n2)X1,X2X1,X2 相互独立,那么 X1+X2χ2(n1+n2)X1+X2χ2(n1+n2)

(iii)nnχ2(n)χ2(n)正态分布

(2)t(n)t(n)分布(nn为自由度)

设 ​XN(0,1),Yχ2(n)XN(0,1),Yχ2(n)​,​X,YX,Y​ 相互独立

则统计量 T=XY/nt(n)T=XY/nt(n)tt 统计量,其分布称为自由度为 nntt 分布

其密度函数为 f(t)=Γ(n+12)nπΓ(n2)(1+t2n)n+12f(t)=Γ(n+12)nπΓ(n2)(1+t2n)n+12<t<+<t<+,过程略,用雅可比行列式是可以求出来的

性质

(i)fn(t)fn(t) 是偶函数

(ii)nnfn(t)fn(t) 标准正态分布

tt 的分位数为 tα(n)tα(n)

(iii)t1α(n)=tα(n)t1α(n)=tα(n)

(iiii)n很大,tαuαtαuα

(3)F(n,m)F(n,m)分布(nnmm分别为第一、二自由度)

Xχ2(n),Yχ2(m)Xχ2(n),Yχ2(m)X,YX,Y 相互独立,则称:

F=X/nY/mF(n,m)F=X/nY/mF(n,m)

FF 统计量,其分布称为第一、二自由度为 nnmmFF 分布

其密度函数为

f(t,n,m)=Γ(n+m2)Γ(n2)Γ(m2)(nm)n2tn21(1+nmt)n+m2,(t>0)f(t,n,m)=Γ(n+m2)Γ(n2)Γ(m2)(nm)n2tn21(1+nmt)n+m2,(t>0)

证明用雅可比行列式

性质

(i)若 FF(n,m)FF(n,m),则 1FF(m,n)1FF(m,n)

F(n,m)F(n,m) 分布的上侧分位数为 Fα(n,m)Fα(n,m)

(ii)F1α(n,m)=1Fα(m,n)F1α(n,m)=1Fα(m,n)

正态总体之样本均值于样本方差的一些结论

设总体 XN(μ,σ2)XN(μ,σ2),样本为 (X1,,Xn)(X1,,Xn)

则样本均值

结论1

¯XN(μ,σ2n)¯¯¯¯¯XN(μ,σ2n),即 ¯Xμσ/nN(0,1)¯¯¯¯¯Xμσ/nN(0,1)

同时有:

结论2

(n1)S2σ2=ni=1(X¯Xσ)2χ2(n1)(n1)S2σ2=ni=1(X¯¯¯¯¯Xσ)2χ2(n1)

结论3

(n1)S2σ2(n1)S2σ2¯X¯¯¯¯¯X 相互独立(或 S2S2¯X¯¯¯¯¯X 相互独立)

证明2、3

Zi=XiμσZi=Xiμσ,则 Z1,Z2,,ZnN(0,1)Z1,Z2,,ZnN(0,1),且互相独立

¯Z=1nni=1Zi=¯Xμσ¯¯¯¯Z=1nni=1Zi=¯¯¯¯¯Xμσ

(n1)S2σ2=ni=1(Xi¯X)2σ2=ni=1(Zi¯Z)2=ni=1Z2in¯Z2(n1)S2σ2=ni=1(Xi¯¯¯¯¯X)2σ2=ni=1(Zi¯¯¯¯Z)2=ni=1Z2in¯¯¯¯Z2

取正交矩阵 A=(ai,j)A=(ai,j),其中 a1,j=1na1,j=1n

Y=AZY=AZ

由于 Yi=nj=1ai,jZjYi=nj=1ai,jZj,故 Y1,Y2,,YnN(0,1)Y1,Y2,,YnN(0,1),且有 E(Yi)=0E(Yi)=0

又由 cov(Zi,Zj)=[i=j]cov(Zi,Zj)=[i=j],及 AA 正交,有:

cov(Yi,Yj)=cov(nk=1ai,kZk,nl=1aj,lZl)=nk=1nl=1ai,kaj,lcov(Zk,Zl)=nk=1nl=1ai,kaj,l[k=l]=[i=j]cov(Yi,Yj)=cov(nk=1ai,kZk,nl=1aj,lZl)=nk=1nl=1ai,kaj,lcov(Zk,Zl)=nk=1nl=1ai,kaj,l[k=l]=[i=j]

于是,Y1,,YnY1,,Yn 相互独立(这里有点奇怪,cov=0cov=0 不代表独立,可能是 YY 生成方式导致的)

Y1=j=1a1,jZj=n¯Z=n¯XμσY1=j=1a1,jZj=n¯¯¯¯Z=n¯¯¯¯¯Xμσ

Y2i=YTY=ZTATAZ=ZTZ=Z2iY2i=YTY=ZTATAZ=ZTZ=Z2i

(n1)S2σ2=ni=1Z2in¯Z2=ni=1Y2iY21χ2(n1)(n1)S2σ2=ni=1Z2in¯¯¯¯Z2=ni=1Y2iY21χ2(n1)

¯X¯¯¯¯¯X 只和 Y1Y1 有关,S2S2 只和 Y2,,YnY2,,Yn 有关,因此相互独立

结论4

¯XμS/n=¯Xμσ/n÷Sσt(n1)¯¯¯¯¯XμS/n=¯¯¯¯¯Xμσ/n÷Sσt(n1)

X1,,XnN(μ1,σ21)X1,,XnN(μ1,σ21)Y1,,YmN(μ2,σ22)Y1,,YmN(μ2,σ22),且所有随机变量相互独立

S21=1n1ni=1(Xi¯X)2,S22=1m1mi=1(Yi¯Y)2S21=1n1ni=1(Xi¯¯¯¯¯X)2,S22=1m1mi=1(Yi¯¯¯¯Y)2

(n1)S21σ21χ2(n1)(n1)S21σ21χ2(n1)(m1)S22σ22χ2(m1)(m1)S22σ22χ2(m1)

且相互独立,从而

结论5

S21/σ21S22/σ22F(n1,m1)S21/σ21S22/σ22F(n1,m1)

结论6

σ1=σ2=σσ1=σ2=σ,则有

¯X=1nni=1XiN(μ1,σ2n)¯¯¯¯¯X=1nni=1XiN(μ1,σ2n)

¯Y=1mmi=1YiN(μ2,σ2m)¯¯¯¯Y=1mmi=1YiN(μ2,σ2m)

¯X¯YN(μ1μ2,σ2n+σ2m)¯¯¯¯¯X¯¯¯¯YN(μ1μ2,σ2n+σ2m)

标准化:

(¯X¯Y)(μ1μ2)σ2n+σ2mN(0,1)(¯¯¯¯¯X¯¯¯¯Y)(μ1μ2)σ2n+σ2mN(0,1)

(n1)S21σ2χ2(n1)(n1)S21σ2χ2(n1)

(m1)S22σ2χ2(m1)(m1)S22σ2χ2(m1)

且相互独立,根据 χ2(n)χ2(n) 的可加性,有:

(n1)S21σ2+(m1)S22σ2χ2(n+m2)(n1)S21σ2+(m1)S22σ2χ2(n+m2)

而由结论3可知 ¯X¯Y¯¯¯¯¯X¯¯¯¯Y(n1)S21σ2+(m1)S22σ2(n1)S21σ2+(m1)S22σ2 相互独立,因此:

(¯X¯Y)(μ1μ2)σ2n+σ2m(n1)S21σ2+(m1)S22σ2n+m2t(n+m2)(¯¯¯¯¯X¯¯¯¯Y)(μ1μ2)σ2n+σ2m(n1)S21σ2+(m1)S22σ2n+m2t(n+m2)

化简一下:

(¯X¯Y)(μ1μ2)1n+1m(n1)S21+(m1)S22n+m2t(n+m2)(¯¯¯¯¯X¯¯¯¯Y)(μ1μ2)1n+1m(n1)S21+(m1)S22n+m2t(n+m2)

点估计

总体 ​​XX​​ 的分布函数的形式已知,但含有 ​​kk​​ 个位置参数 ​​θ1,,θkθ1,,θk​​,基于总体的一个样本 ​​X1,,XnX1,,Xn​​,构造 ​​kk​​ 个统计量,​​ˆθ1(X1,,Xn),ˆθ2(X1,,Xn),,ˆθk(X1,,Xn)^θ1(X1,,Xn),^θ2(X1,,Xn),,^θk(X1,,Xn)​​ 作为 ​θ1,θ2,,θnθ1,θ2,,θn​ 的估计

(1)矩估计

用矩来估计,计算样本 (X1,,Xn)(X1,,Xn)rr 阶矩 Ar=1nni=1XriAr=1nni=1Xri,对每个 r=1,2,,kr=1,2,,k

列出方程 μr(ˆθ1,ˆθ2,,ˆθk)=1nni=1Xriμr(^θ1,^θ2,,^θk)=1nni=1Xrir=1,2,,kr=1,2,,k

kk 个未知数 kk 个方程,可以解出 (ˆθi)(^θi)

(2)极大似然估计

设总体 XX 的概率密度函数为 f(x;θ)f(x;θ)

对于总体 XX 的随机样本 (X1,,Xn)(X1,,Xn),其联合密度函数为:

L(x1,,xn,θ)=ni=1f(xi,θ)L(x1,,xn,θ)=ni=1f(xi,θ)

当样本 (X1,,Xn)(X1,,Xn) 观测值 x1,,xnx1,,xn 给定时,L(x1,,xn)L(x1,,xn) 退变为 θθ 的函数,记为 L(θ)L(θ),称 L(θ)L(θ) 为样本的似然函数

极大似然估计就是选择适当的 θθ,使 L(θ)L(θ) 取到最大值

这样得到的 ˆθ=g(x1,x2,,xn)^θ=g(x1,x2,,xn) 为参数 θθ 的极大似然估计值

称相应的统计量 ˆθ=g(X1,X2,,Xn)^θ=g(X1,X2,,Xn) 为参数 θθ 的极大似然估计量

多个待估参数量的情形是同理的

如果似然函数关于变量 θ1,,θkθ1,,θk 可微,那么可以列方程组(偏导为0),得到极大似然估计

估计量的评价

无偏性

(X1,,Xn)(X1,,Xn)XX 的样本,ˆθ(X1,,Xn)^θ(X1,,Xn) 是总体参数 θθ 的估计量,如果 E(ˆθ)=θE(^θ)=θ,则称 ˆθ^θθθ 的无偏估计量

S2S2​ 是 ​σ2σ2​ 的无偏估计量,易证

SS 不是 σσ 的无偏估计量,这个证明有点复杂,结论是 S2Γ(n2)n1Γ(n12)S2Γ(n2)n1Γ(n12)σσ 的无偏估计量

有效性

如果 ˆθ1^θ1ˆθ2^θ2 都是 θθ 的无偏估计量,如果 D(ˆθ1)<D(ˆθ2)D(^θ1)<D(^θ2),则称 ˆθ1^θ1ˆθ2^θ2 更有效

一致性

nnˆθ^θ 依概率收敛于 θθ,称 ˆθ^θ 是总体参数 θθ 的一致估计量

关于一致性的常用结论

(i)样本 kk 阶矩是总体 kk 阶矩的一致估计量(由大数定律可得)

(ii)无偏估计量 ​ˆθ^θ​ 趋于无穷时方差为 ​00​,则 ˆθ^θθθ 的一致估计量(切比雪夫不等式)

矩估计法得到的估计量一般为一致估计量

区间估计

对待估未知参数,不是一个量来估计,而是两个量(值)确定一个范围,即一个区间,来估计

置信区间与置信度

对于一个给定的数 αα0<α<10<α<1

构造两个量 ​ˆθ1(X1,,Xn)^θ1(X1,,Xn)​ 和 ​ˆθ2(X1,,Xn)^θ2(X1,,Xn)​,使得 ​P(ˆθ1<θ2)P(^θ1<θ2)

则称概率值 1α1α 为置信水平或置信度,称两统计量形成的区间 (ˆθ1,ˆθ2)(^θ1,^θ2) 是一个随机区间,称该随机区间为参数 θθ 的置信度为 1α1α 的置信区间,并分别称 ˆθ1,ˆθ2^θ1,^θ2 为置信下限和置信上限

置信区间求解的基本步骤

(1)寻找一个样本函数 ​g(X1,X2,,Xn,θ)g(X1,X2,,Xn,θ)​,称为枢轴量,它含有待估参数,不含其它未知参数,它的分布已知,且分布不依赖于待估参数

(2)对于给定置信度 1α1α,确定出常数 aabb,使得 P(a<g(X1,,Xn)<b)=1αP(a<g(X1,,Xn)<b)=1α

(3)由(2)的不等式解出关于 θθ 的置信上下限,ˆθ1^θ1ˆθ2^θ2,即有 P(ˆθ1<θ<ˆθ2)=1αP(^θ1<θ<^θ2)=1α,即得到置信区间 (ˆθ1,ˆθ2)(^θ1,^θ2)

正态总体置信区间

考虑总体服从正态分布的情形,并分两种情况:

  • 一个正态总体
  • 两个正态总体

注:记 uα,tα(n),χ2α(n),Fα(n,m)uα,tα(n),χ2α(n),Fα(n,m) 分别为标准正态分布、t(n)t(n) 分布、χ2(n)χ2(n) 分布、F(n,m)F(n,m) 分布的 αα 下侧分位数

一个正态总体的情形:

(1)方差 σ2σ2 已知,μμ 的置信区间

取枢轴量 ¯Xμσ/nN(0,1)¯¯¯¯¯Xμσ/nN(0,1)

P(|¯Xμσ/n|<u1α2)=1αP(|¯¯¯¯¯Xμσ/n|<u1α2)=1α

得到置信区间 (¯Xu1α2σn,¯X+u1α2σn)(¯¯¯¯¯Xu1α2σn,¯¯¯¯¯X+u1α2σn)

(2)方差 σ2σ2 未知,μμ 的置信区间

取枢轴量 ¯XμS/nt(n1)¯¯¯¯¯XμS/nt(n1),置信区间略

(3) μμ 已知,方差 σ2σ2 的置信区间

取枢轴量

ni=1(Xiμσ)2χ2(n)ni=1(Xiμσ)2χ2(n)

(4) μμ 未知,方差 σ2σ2 的置信区间

取枢轴量

(n1)S2σ2χ2(n1)(n1)S2σ2χ2(n1)

接下来是两个正态总体的情形

(1) σ21,σ22σ21,σ22 已知,μ1μ2μ1μ2 的置信区间

取枢轴量

(¯X¯Y)(μ1μ2)σ21n+σ22mN(0,1)(¯¯¯¯¯X¯¯¯¯Y)(μ1μ2)σ21n+σ22mN(0,1)

(2) ​σ21,σ22σ21,σ22​ 未知(但 ​σ21=σ22=σ2σ21=σ22=σ2​),​μ1μ2μ1μ2​ 的置信区间

取枢轴量

(¯X¯Y)(μ1μ2)1n+1m(n1)S21+(m1)S22n+m2t(n+m2)(¯¯¯¯¯X¯¯¯¯Y)(μ1μ2)1n+1m(n1)S21+(m1)S22n+m2t(n+m2)

(3) σ21,σ22σ21,σ22 未知,n,m>50n,m>50μ1μ2μ1μ2 的置信区间

取枢轴量

(¯X¯Y)(μ1μ2)S21n+S22m近似N(0,1)(¯¯¯¯¯X¯¯¯¯Y)(μ1μ2)S21n+S22mN(0,1)

(4) σ21,σ22σ21,σ22 未知,但 n=mn=mμ1μ2μ1μ2 的置信区间

Zi=XiYiZi=XiYi,可以将它看作来自正态总体 ZN(μ1μ2,σ21+σ22)ZN(μ1μ2,σ21+σ22) 的样本

然后和一个正态总体的 μμ 的置信区间做法一样

(5)方差比 σ21σ22σ21σ22 的置信区间(μ1,μ2μ1,μ2 未知)

取枢轴量

F=S21/σ21S22/σ22F(n1,m1)F=S21/σ21S22/σ22F(n1,m1)

(6)方差比 σ21σ22σ21σ22 的置信区间(μ1,μ2μ1,μ2 已知)

取枢轴量

F=1nni=1(Xiμ1σ1)21mmi=1(Yiμ2σ2)2F(n,m)F=1nni=1(Xiμ1σ1)21mmi=1(Yiμ2σ2)2F(n,m)

非正态总体的置信区间

通过中心极限定理,即得到一个式子,nn 很大的时候服从正态分布

假设检验

显著性水平

构造拒绝域

对假设检验问题,若 WW 为样本空间的一个子集,设 (X1,,Xn)(X1,,Xn) 为样本,θθ 为原假设,对于一个小概率 α(0,1)α(0,1)WW 满足:

Pθ((X1,,Xn)W)αPθ((X1,,Xn)W)α

则称 WW 构成了原假设的一个拒绝域,称 αα 为显著性水平,并称此由 WW 构成拒绝域的方法为显著性水平为 αα 的方法

假设检验步骤

根据实际问题,建立 H0H0H1H1,在 H0H0 为真的情况下,选择合适的统计量 VV

根据 H1H1 确定出拒绝域的形式

检验样本是否落入拒绝域

得出结论,接受 H0H0H1H1

两类错误概率及检验的评价准则

第一类错误

弃真,在 H0H0 为真的情况下,拒绝了 H0H0,错误概率通常记作 αα

第二类错误

纳伪,在 H0H0 为假的情况下,接受了 H0H0,错误概率通常记作 ββ

功效函数

θθ 为总体带推断的参数,对于一个具有拒绝域 WW 的检验 ττ,定义:

β(θ)=Pθ(W):=Pθ((X1,,Xn)W)β(θ)=Pθ(W):=Pθ((X1,,Xn)W)

为该检验的功效函数(也记为 βWβWβτβτ

易见,功效函数,即样本落入拒绝域的概率,是总体分布的参数 θθ 的函数

基于功效函数概念,对于假设 H0:θΘ0H0:θΘ0H1:θΘ1H1:θΘ1,分析犯两类错误的概率 α,βα,β

θΘ0θΘ0 时,即 H0H0 为真,落入拒绝域即犯第一类错误的概率:α=β(θ)α=β(θ)(θΘ0)(θΘ0)

θΘ1θΘ1 时,即 H1H1 为真,落入拒绝域之外即犯第二类错误的概率:β=1β(θ)β=1β(θ)(θΘ1)(θΘ1)

一致最优检验

对于一个 αα,设 ττ 为一个水平为 αα 的检验,若对于一个水平为 αα 的检验 ττ,都有 βτ(θ)βτ(θ),θΘ1βτ(θ)βτ(θ),θΘ1

ττ 为一致最优检验,记为 UMP 检验(uniformly most powerfule test)

UMP 检验,在第一个错误控制在 αα 内的情况下,总使第二类错误概率达到最小

无偏检验

对于假设 H0:θΘ0H0:θΘ0H1:θΘ1H1:θΘ1ττ 为一检验,其功效为 β(θ)β(θ)

若对任意 θ0Θ0θ0Θ0θ1Θ1θ1Θ1,都有:

β(θ0)β(θ1)β(θ0)β(θ1)

则称 ττ 为一个无偏检验

即,要求一个检验犯第一类错误的概率总不超过不犯第二类错误的概率

正态总体的假设检验(参数检验)

几乎与置信区间内容相同

总体分布的假设检验(非参数检验)

χ2χ2 检验法

设完备事件组 A1,,AkA1,,Ak,原假设 H0:P(Ai)=pi,i=1,2,,kH0:P(Ai)=pi,i=1,2,,k

进行 nn 次独立重复试验,事件出现的频数分别为 v1,,vkv1,,vk

定理(Pearson):若假设 H0H0 成立,则当 nn 时,

V=ki=1(vinpi)2npiV=ki=1(vinpi)2npi

趋于 χ2(kr1)χ2(kr1) 分布,其中 rr 是用最大似然估计的未知参数个数

Pearson χ2χ2 检验:拒绝域 V>χ21α(kr1)V>χ21α(kr1)

偏度、峰度检验法

G1=B3/B3/22G1=B3/B3/22(称为样本偏度)

G2=B4/B22G2=B4/B22(称为样本峰度)

若总体 XX 为正态变量,则可证:

nn 充分大时,近似地有 G1N(0,σ21)G1N(0,σ21)G2N(μ2,σ22)G2N(μ2,σ22),其中

σ21=6(n2)(n+1)(n+3)μ2=36n+1σ22=24n(n2)(n3)(n+1)2(n+3)(n+5)σ21=6(n2)(n+1)(n+3)μ2=36n+1σ22=24n(n2)(n3)(n+1)2(n+3)(n+5)

方差分析

单因素方差分析(实验次数相等)

设因子 AAmm 个水平,分别记为 A1,,AmA1,,Am,在每一种水平下,均进行 kk 次试验,每次试验可记为 Xi,jXi,j,观察值为 xi,jxi,j

为了方便,进一步假定这些总体为正态总体且具有相同的方差,于是:

Xi,jN(μi,σ2)Xi,jN(μi,σ2)

原问题:考察因子 AA 对试验结果是否有显著影响

转化为:同方差总体(正态)期望是否相同

εiεi 是因子 AA 的第 ii 个水平 AiAi 所引起的差异:εi=μiμεi=μiμ 称为水平 AiAi 的效应,其中 μ=1mmi=1μiμ=1mmi=1μi 称为均值(期望)的总平均

相当于假设检验 H0:μ1=μ2==μH0:μ1=μ2==μH0:ε1=ε2==0H0:ε1=ε2==0

假设检验是第一个任务,第二个任务是对 μ1,,μm,σ2μ1,,μm,σ2 进行参数估计

水平 ​AiAi​ 下的样本均值(又称为组内平均值)

¯Xi=1kki=1Xi,j¯¯¯¯¯Xi=1kki=1Xi,j

数据总平均

¯X=1mmi=1¯Xi=1mkmi=1kj=1Xi,j¯¯¯¯¯X=1mmi=1¯¯¯¯¯Xi=1mkmi=1kj=1Xi,j

总离差平方和

ST=mi=1kj=1(Xi,j¯X)2ST=mi=1kj=1(Xi,j¯¯¯¯¯X)2

在假设 H0H0 成立时,STχ2(mk1)STχ2(mk1)

事实上,ST=(mk1)S2ST=(mk1)S2,其中 S2S2 是总样本方差

误差平方和

Se=mi=1kj=1(Xi,j¯Xi)2Se=mi=1kj=1(Xi,j¯¯¯¯¯Xi)2

反应组内(在同一水平下)样本的随机波动

效应平方和(组间平方和)

SA=mi=1kj=1(¯Xi¯X)2=kmi=1(¯Xi¯X)2SA=mi=1kj=1(¯¯¯¯¯Xi¯¯¯¯¯X)2=kmi=1(¯¯¯¯¯Xi¯¯¯¯¯X)2

在一定程度上反应由组间(因子各个水平之间)不同引起的差异

平方和分解公式

ST=SA+SeST=SA+Se

这是因为:

(Xi,j¯X)2=(Xi,j¯Xi+¯Xi¯X)2=(Xi,j¯Xi)2+(¯Xi¯X)2+2(Xi,j¯Xi)(¯Xi¯X))(Xi,j¯¯¯¯¯X)2=(Xi,j¯¯¯¯¯Xi+¯¯¯¯¯Xi¯¯¯¯¯X)2=(Xi,j¯¯¯¯¯Xi)2+(¯¯¯¯¯Xi¯¯¯¯¯X)2+2(Xi,j¯¯¯¯¯Xi)(¯¯¯¯¯Xi¯¯¯¯¯X))

同时:

mi=1kj=1(Xi,j¯Xi)(¯Xi¯X)=mi=1(¯Xi¯X)kj=1(Xi,j¯Xi)=0mi=1kj=1(Xi,j¯¯¯¯¯Xi)(¯¯¯¯¯Xi¯¯¯¯¯X)=mi=1(¯¯¯¯¯Xi¯¯¯¯¯X)kj=1(Xi,j¯¯¯¯¯Xi)=0

结合一下就证明了

检验统计量

注意到:

SAσ2χ2(m1)SAσ2χ2(m1)

Seσ2χ2(nm)Seσ2χ2(nm)

因此检验统计量:

F=SA/(m1)Se/(nm)F(m1,nm)F=SA/(m1)Se/(nm)F(m1,nm)

平方和分解定理(证略)

QQ 服从自由度为 nnχ2χ2 分布,又

Q=Q1+Q2++QkQ=Q1+Q2++Qk

其中 QiQi 是秩为 fifi 的非负二次型,则 QiQi 互相独立且分布服从自由度为 fifiχ2χ2 分布的充要条件是:

f1+f2++fk=nf1+f2++fk=n

单因素方差分析(实验次数不等)

与相等的类似,检验统计量

F=SA/(m1)Se/(nm)F(m1,nm)F=SA/(m1)Se/(nm)F(m1,nm)

平方和的计算

Ti=nij=1xi,jTi=nij=1xi,jCT=n¯x2=1n(mi=1Ti)2CT=n¯¯¯x2=1n(mi=1Ti)2

ST=mi=1nij=1(xi,j¯x)2=mi=1nij=1x2i,jCTST=mi=1nij=1(xi,j¯¯¯x)2=mi=1nij=1x2i,jCT

SA=mi=1nij=1(¯xi¯x)2=mi=1T2inCTSA=mi=1nij=1(¯¯¯xi¯¯¯x)2=mi=1T2inCT

Se=STSASe=STSA

双因子方差分析(双因子间无交互作用)

A,BA,B 是两个因子,A1,,AnA1,,AnAAnn 个水平,B1,,BmB1,,BmBBmm 个水平

实验结果以 Xi,jXi,j 表示,其观察值为 xi,jxi,j,假定在每种组合下实验结果 Xi,jXi,j 满足 N(μi,j,σ2)N(μi,j,σ2)

并设满足如下定义的效应可加性:μi,j=μ+αi+βjμi,j=μ+αi+βj,其中 αiαi 为因子水平 AiAi 的效应,βjβj 为因子水平 BjBj 的效应

于是,与单因素方差分析类似,可作问题转化:判定 A,BA,B 两因子对试验指标的影响是否显著的问题

相当于检验一下假设:H0:μ1,1=μ1,2==μi,j==μn,mH0:μ1,1=μ1,2==μi,j==μn,m

一些统计量的定义

数据总平均:

¯X=¯X,=1nmni=1mj=1Xi,j¯¯¯¯¯X=¯¯¯¯¯¯¯¯¯¯X,=1nmni=1mj=1Xi,j

水平 AiAi 的组内平均值:

¯Xi,=1mmj=1Xi,j¯¯¯¯¯¯¯¯¯Xi,=1mmj=1Xi,j

水平 BjBj 的组内平均值:

¯X,j=1nni=1Xi,j¯¯¯¯¯¯¯¯¯X,j=1nni=1Xi,j

总离差平方和:

ST=ni=1mj=1(Xi,j¯X)2ST=ni=1mj=1(Xi,j¯¯¯¯¯X)2

因子 AA 效应平方和(组间):

SA=ni=1mj=1(¯Xi,¯X)2=mni=1(¯Xi,¯X)2SA=ni=1mj=1(¯¯¯¯¯¯¯¯¯Xi,¯¯¯¯¯X)2=mni=1(¯¯¯¯¯¯¯¯¯Xi,¯¯¯¯¯X)2

因子 BB 效应平方和(组间):

SB=ni=1mj=1(¯X,j¯X)2=nmj=1(¯X,j¯X)2SB=ni=1mj=1(¯¯¯¯¯¯¯¯¯X,j¯¯¯¯¯X)2=nmj=1(¯¯¯¯¯¯¯¯¯X,j¯¯¯¯¯X)2

误差平方和(组内):

Se=ni=1mj=1(Xi,j¯Xi,¯X,j+¯X)2Se=ni=1mj=1(Xi,j¯¯¯¯¯¯¯¯¯Xi,¯¯¯¯¯¯¯¯¯X,j+¯¯¯¯¯X)2

与单因素方差分析类似,可得如下分解公式:

ST=SA+SB+SeST=SA+SB+Se

检验统计量

FA=SA/(n1)Se/(n1)(m1)F(n1,(n1)(m1))FB=SB/(m1)Se/(n1)(m1)F(m1,(n1)(m1))FA=SA/(n1)Se/(n1)(m1)F(n1,(n1)(m1))FB=SB/(m1)Se/(n1)(m1)F(m1,(n1)(m1))

平方和计算

SA=1mni=1T2i,T2,nmSA=1mni=1T2i,T2,nm

SB=1nmj=1T2,jT2,n,mSB=1nmj=1T2,jT2,n,m

TS:=ni=1mj=1X2i,jTS:=ni=1mj=1X2i,j

双因子方差分析(双因子间有交互作用)

每个 AiAiBjBj 都要做 rr 次,设为 Xi,j,kN(μi,j,k,σ2)Xi,j,kN(μi,j,k,σ2)

并设有 μi,j,k=μ+αi+βj+γi,jμi,j,k=μ+αi+βj+γi,j

判定有无显著影响的问题转化为检验假设 H0:μi,j,k=0,i,j,kH0:μi,j,k=0,i,j,k

(这里还有一堆,先略了)

回归分析

一元线性回归模型

样本点 (xi,yi)(xi,yi)i=1,2,,ni=1,2,,n

其中,变量间的线性相关的关系可用如下数学关系式表示:Y=a+bx+εY=a+bx+ε,其中 εN(0,σ2)εN(0,σ2)

待定常数 a,ba,b 称为模型参数,即回归系数,且 a,b,σ2a,b,σ2 均不依赖于 xx

回归系数的极大似然估计

为了方便,引入如下统计量:

Sxx=ni=1(xi¯x)2Sxx=ni=1(xi¯¯¯x)2

Sxy=ni=1(xi¯x)(yi¯y)Sxy=ni=1(xi¯¯¯x)(yi¯¯¯y)

Syy=ni=1(yi¯y)2Syy=ni=1(yi¯¯¯y)2

由于 Y=a+bx+εY=a+bx+ε,有 YiN(a+bx,σ2)YiN(a+bx,σ2),则似然函数

L(a,b)=ni=112πσe(yiabxi)22σ2L(a,b)=ni=112πσe(yiabxi)22σ2

极大化这个似然函数

lnL=ni=1ln(12πσ)(yiabxi)22σ2lnL=ni=1ln(12πσ)(yiabxi)22σ2

aabb 的偏导是 00,解得 ˆa=¯yb¯x,ˆb=SxySxx^a=¯¯¯yb¯¯¯x,^b=SxySxx

最小二乘法

求解 ˆa,ˆb^a,^b,使得 ni=1(yiabxi)2=Q(a,b)ni=1(yiabxi)2=Q(a,b) 最小

求偏导解得 ˆa,ˆb^a,^b 与极大似然相同

回归方程的显著性检验

相关系数检验法

r=SxySxxSxyr=SxySxxSxy

|r|=1QSyy|r|=1QSyy

其中 Q=ni=1δ2i=ni=1(yiˆyi)2Q=ni=1δ2i=ni=1(yi^yi)2

假设检验 H0:r=0H0:r=0,检验统计量

t=n2r1r2t(n2)t=n2r1r2t(n2)

|t|>t1α2(n2)|t|>t1α2(n2),拒绝原假设,认为存在线性关系,否则接受原假设,认为不存在线性关系

FF 检验法

假设检验 H0:b=0H0:b=0,检验统计量

F=(n2)UQF(1,n2)F=(n2)UQF(1,n2)

其中 U=ni=1(ˆyi¯y)2=S2xySxxU=ni=1(^yi¯¯¯y)2=S2xySxx

课后验证:Syy=U+QSyy=U+Q

相关性质

H0:b=0H0:b=0H0:r=0H0:r=0 之下,有

Syyσ2χ2(n1)Syyσ2χ2(n1)

Uσ2χ2(1)Uσ2χ2(1)

Qσ2χ2(n2)Qσ2χ2(n2)

QQUU 独立

t=n2r1r2=(n2)(SyyQSyy)QSyy=(n2)USyyQSyy=UQ/(n2)t(n2)t=n2r1r2=(n2)(SyyQSyy)QSyy=(n2)USyyQSyy=UQ/(n2)t(n2)

F=t2=(n2)UQF(1,n2)F=t2=(n2)UQF(1,n2)

多元线性回归

Y=b0+b1x1++bkxk+εY=b0+b1x1++bkxk+ε,常设 εN(0,σ2)εN(0,σ2)

最小二乘法

Q=ni=1(yiˆyi)2Q=ni=1(yi^yi)2​ 对每个 ​bibi​ 求偏导令其为 ​00

posted @   xay5421  阅读(96)  评论(2编辑  收藏  举报
相关博文:
阅读排行:
· Obsidian + DeepSeek:免费 AI 助力你的知识管理,让你的笔记飞起来!
· 分享4款.NET开源、免费、实用的商城系统
· 解决跨域问题的这6种方案,真香!
· 一套基于 Material Design 规范实现的 Blazor 和 Razor 通用组件库
· 5. Nginx 负载均衡配置案例(附有详细截图说明++)
点击右上角即可分享
微信分享提示