信息学中的概率统计
概率
离散型随机变量常见分布
(1)01 分布
(2)二项分布
记作 X∼B(n,p)X∼B(n,p)
(3)几何分布
称 XX 为服从参数为 pp 的几何分布
(4)Pascal分布(负二项分布)
组合意义是 XX 是第 rr 次事件 AA 发生的时刻
(5)超几何分布
设一批产品数为 NN,次品 MM 个,不放回抽样 nn 个,其中次品数为随机变量 XX
(6)泊松分布
记作 X∼π(λ)X∼π(λ) 或 P(λ)P(λ)
泊松定理
设 X∼B(n,pn),n=1,2,…X∼B(n,pn),n=1,2,…
又设 npn→λ>0npn→λ>0,则对固定的 kk
连续型随机变量常见分布
如没有特殊说明,f(x)f(x) 是概率密度函数,F(x)F(x) 是概率分布函数
(1)均匀分布
记作 X∼U(a,b)X∼U(a,b)
(2)指数分布
记作 X∼E(λ)X∼E(λ)
对于任意 0<a<b0<a<b,P(a<X<b)=e−λa−e−λbP(a<X<b)=e−λa−e−λb
(3)正态分布
记作 X∼N(μ,σ2)X∼N(μ,σ2)
正态分布相加还是正态分布,即 X∼N(μ1,σ21)X∼N(μ1,σ21),Y∼N(μ2,σ22)Y∼N(μ2,σ22),且 X,YX,Y 独立,则 X±Y∼N(μ1±μ2,σ21+σ22)X±Y∼N(μ1±μ2,σ21+σ22)
(4)ΓΓ分布
记作 X∼Γ(α,β)X∼Γ(α,β),其中
当 α=1α=1 时,Γ(α,β)Γ(α,β) 退化为 E(β)E(β)
当 α=n2,β=12α=n2,β=12 时,Γ(α,β)Γ(α,β) 退化为自由度为 nn 的 χ2χ2 分布,记作 X∼χ2(n)X∼χ2(n),即 Γ(n2,12)=χ2(n)Γ(n2,12)=χ2(n)
性质
(i)Γ(α+1)=αΓ(α)Γ(α+1)=αΓ(α)
(ii)对于任意正整数,Γ(n+1)=n!Γ(n+1)=n!
(iii)Γ(12)=π12Γ(12)=π12
验证
联合密度
雅可比行列式
已知 X,YX,Y 的联合密度 fXY(x,y)fXY(x,y),设 Z=g(X,Y),U=r(X,Y)Z=g(X,Y),U=r(X,Y),存在唯一的反函数 X=h(Z,U),Y=s(Z,U)X=h(Z,U),Y=s(Z,U),且 h,sh,s 有连续的偏导数,记
那么 fZU(z,u)=fXY(h(z,u),s(z,u))|J(z,u)|fZU(z,u)=fXY(h(z,u),s(z,u))|J(z,u)|,注意是取绝对值
期望方差相关
期望性质
E(X+Y)=E(X)+E(Y)E(X+Y)=E(X)+E(Y)
X,YX,Y 独立 ⇒E(XY)=E(X)E(Y)⇒E(XY)=E(X)E(Y),逆命题不真
E(XY)2≤E(X2)E(Y2)E(XY)2≤E(X2)E(Y2),许瓦尔兹(Schwarz)不等式
许瓦尔兹(Schwarz)不等式证明
∀λ,E((λX+Y)2)=λ2E(X2)+2λE(XY)+E(Y2)≥0⇒Δ≤0⇒E(XY)2≤E(X2)E(Y2)∀λ,E((λX+Y)2)=λ2E(X2)+2λE(XY)+E(Y2)≥0⇒Δ≤0⇒E(XY)2≤E(X2)E(Y2)
方差性质
D(aX+b)=a2D(X)D(aX+b)=a2D(X)
D(X±Y)=D(X)+D(Y)±2E((X−E(X))(Y−E(Y)))D(X±Y)=D(X)+D(Y)±2E((X−E(X))(Y−E(Y)))
若 XX 和 YY 独立,则 D(X±Y)=D(X)+D(Y)D(X±Y)=D(X)+D(Y),反之不成立,于是有若 X1,…,XnX1,…,Xn 独立,D(∑aiXi+b)=∑a2iD(Xi)D(∑aiXi+b)=∑a2iD(Xi)。
对于任意常数 CC,D(X)≤E(X−C)2D(X)≤E(X−C)2,取等当且仅当 C=E(X)C=E(X)
协方差性质
若 E((X−E(X))(Y−E(Y)))E((X−E(X))(Y−E(Y))) 存在,称为 XX 和 YY 的协方差,记作 cov(X,Y)cov(X,Y)
cov(X,Y)=cov(Y,X)=E(XY)−E(X)E(Y)cov(X,Y)=cov(Y,X)=E(XY)−E(X)E(Y)
cov(X,X)=D(X)cov(X,X)=D(X)
cov(a1X+b1,a2X+b2)=a1a2cov(X,Y)cov(a1X+b1,a2X+b2)=a1a2cov(X,Y)
cov(X+Y,Z)=cov(X,Z)+cov(Y,Z)cov(X+Y,Z)=cov(X,Z)+cov(Y,Z)
cov(X,Y)2≤D(X)D(Y)cov(X,Y)2≤D(X)D(Y),证明:展开后使用期望的最后一条性质——许瓦尔兹(Schwarz)不等式
相关系数性质
定义 ρ(X,Y)=cov(X,Y)√D(X)√D(Y)ρ(X,Y)=cov(X,Y)√D(X)√D(Y) 为 XX 和 YY 的相关系数,即 ρ(X,Y)=cov(X∗,Y∗)ρ(X,Y)=cov(X∗,Y∗),即将 XX 和 YY 标准化之后的协方差
ρ(X,Y)=0⇔cov(X,Y)=0⇔E(XY)=E(X)E(Y)⇔D(X±Y)=D(X)+D(Y)ρ(X,Y)=0⇔cov(X,Y)=0⇔E(XY)=E(X)E(Y)⇔D(X±Y)=D(X)+D(Y),但并不能说明独立,除非是 XX 和 YY 服从二维正态分布
协方差矩阵
设 nn 维随机变量 (X1,X2,…,Xn)(X1,X2,…,Xn),记 σi,j=cov(Xi,Xj)σi,j=cov(Xi,Xj),若 σi,jσi,j 都存在,则称
为 (X1,X2,…,Xn)(X1,X2,…,Xn) 的协方差矩阵
(i)非负定
(ii)σi,i=D(Xi)σi,i=D(Xi)
(iii)σ2i,j≤σi,iσj,jσ2i,j≤σi,iσj,j(协方差最后的一个性质)
协方差向量表示
X=(X1,X2,…,Xn)T,E(X)=(EX1,EX2,…,EXn)TX=(X1,X2,…,Xn)T,E(X)=(EX1,EX2,…,EXn)T
那么 Σ(X)=E((X−EX)(X−EX)T)Σ(X)=E((X−EX)(X−EX)T)
𝐧n 维正态分布的向量表示
对于 nn 维正态随机变量 (X1,X2,…,Xn)(X1,X2,…,Xn),其分布可表示为 (X1,X2,…,Xn)∼N(μ,Σ)(X1,X2,…,Xn)∼N(μ,Σ),其中 μ=(μ1,μ2,…,μn)μ=(μ1,μ2,…,μn) 是 nn 维期望向量,ΣΣ 是协方差矩阵
记 x=(x1,x2,…,xn)x=(x1,x2,…,xn),那么
线性变换下的协方差(矩阵)
设 Y=AXY=AX,AA 是非退化的 nn 阶矩阵
概率极限理论
随机变量序列的收敛性
对于概率空间 (Ω,F,P)(Ω,F,P) 上的随机变量序列 {Xn}{Xn} 和随机变量 XX
(1)概率为 𝟏1 地收敛于 𝐗X
如果 P(limn→∞Xn=X)=1P(limn→∞Xn=X)=1,则称 {Xn}{Xn} 概率为 11 的收敛于 XX
记作 limn→∞Xna.e=Xlimn→∞Xna.e=X 或 Xna.e→XXna.e→X
另一种说法:令 A={ω∣limn→∞Xn(ω)=X(ω)}A={ω∣limn→∞Xn(ω)=X(ω)} 是一个随机事件,则 limn→∞Xna.e=X⇔P(A)=1limn→∞Xna.e=X⇔P(A)=1
(2)依概率收敛于 XX
如果 ∀ε>0,limn→∞P(|Xn−X|<ε)=1∀ε>0,limn→∞P(|Xn−X|<ε)=1,则称 {Xn}{Xn} 依概率收敛于 XX
记作 limn→∞XnP=Xlimn→∞XnP=X 或 XnP→XXnP→X
另一种说法:An,ε={ω∣|Xn(ω)−X(ω)|<ε}An,ε={ω∣|Xn(ω)−X(ω)|<ε},则 limn→∞P=X⇔∀ε>0,limn→∞P(An,ε)=1limn→∞P=X⇔∀ε>0,limn→∞P(An,ε)=1
(3)依分布收敛
{Xn}{Xn} 相应分布函数序列收敛
记作 limn→∞Xnd=Xlimn→∞Xnd=X 或 Xnd→XXnd→X
大数定律
重要不等式
设非负随机变量 XX 的期望 E(X)E(X) 存在,则对于任意实数 ε>0ε>0,有
证明:设 A={ω∣X(ω)≥ε}A={ω∣X(ω)≥ε},构造 IA(ω)=[ω∈A]IA(ω)=[ω∈A],显然有 εIA(ω)≤X(ω)εIA(ω)≤X(ω),于是 E(εIA)≤E(X)E(εIA)≤E(X),又有 E(εIA)=εE(IA)=εP(A)E(εIA)=εE(IA)=εP(A),因此 P(X≥ε)≤E(X)εP(X≥ε)≤E(X)ε
推论1:马尔可夫不等式
设 E(|X|k)E(|X|k) 存在,有
推论2:切比雪夫不等式
设 D(X)D(X) 存在,有
大数定律定义
对于随机变量序列 {Xk}{Xk},每个 E(Xk)E(Xk) 都存在,记 ¯Xn=1n∑nk=1Xk¯¯¯¯¯Xn=1n∑nk=1Xk
当 n→+∞n→+∞,¯Xn−E(¯Xn)P→0¯¯¯¯¯Xn−E(¯¯¯¯¯Xn)P→0,则称 {Xk}{Xk} 服从大数定律
伯努利大数定律
{Xk=第 k 次实验(0-1分布)}{Xk=第 k 次实验(0-1分布)} 服从大数定律
证明:设 nA=∑nk=1XknA=∑nk=1Xk,于是 ¯Xn=nAn¯¯¯¯¯Xn=nAn。∀ε>0∀ε>0,P(¯Xn−E(¯Xn))≥ε≤D(¯Xn)ε2=p(1−p)nε2→0,(n→∞)P(¯¯¯¯¯Xn−E(¯¯¯¯¯Xn))≥ε≤D(¯¯¯¯¯Xn)ε2=p(1−p)nε2→0,(n→∞)
切比雪夫大数定律
设 X1,X2,…,XnX1,X2,…,Xn 独立,且具有相同的数学期望 μμ 和方差 σ2σ2
则 {X1,X2,…,Xn}{X1,X2,…,Xn} 服从大数定律
证明:和伯努利大叔定律的证明类似
扩展结论1
如果 XkXk 互相独立,但不具有相同的数学期望的方差时,可设 E(Xk)=μk,D(Xk)=σ2k≤σ2E(Xk)=μk,D(Xk)=σ2k≤σ2
有 ∀ε>0,limn→∞P(|¯Xn−1n∑nk=1μk|≥ε)=0∀ε>0,limn→∞P(|¯¯¯¯¯Xn−1n∑nk=1μk|≥ε)=0
扩展结论2
可以去掉 XkXk 相互独立,代之以 1n2D(∑nk=1Xk)n→∞→01n2D(∑nk=1Xk)n→∞→0
辛钦大数定律
如果 XkXk 独立同分布,期望存在,则 {X1,X2,…,Xk}{X1,X2,…,Xk} 满足大数定律
强大数定律
在大数定律的基础上,如果是概率为 11 的收敛,那么服从强大数定律
伯努利、辛钦都是强大数定律,切比雪夫要加入条件 ∑∞k=1D(Xn)n2∑∞k=1D(Xn)n2 收敛才是强大数定律
中心极限定理
对于随机变量序列 {Xk}{Xk},如果 ∑nk=1Xk∑nk=1Xk 的标准化变量依分布收敛到正态分布,则称 {Xk}{Xk} 服从中心极限定理
独立同分布极限定理
XkXk 独立同分布,期望和方差都存在,那么序列服从中心极限定理
统计
常用统计量
¯X=1n∑ni=1Xi¯¯¯¯¯X=1n∑ni=1Xi 为样本均值
S2=1n−1∑ni=1(Xi−¯X)2S2=1n−1∑ni=1(Xi−¯¯¯¯¯X)2 为样本方差
Ak=1n∑ni=1XkiAk=1n∑ni=1Xki 为样本 kk 阶原点矩
Bk=1n∑ni=1(Xi−¯X)kBk=1n∑ni=1(Xi−¯¯¯¯¯X)k 为样本 kk 阶中心矩
来自正态总体的常用统计量及其分布
(1) χ2χ2 分布
设 X1,X2,…,XnX1,X2,…,Xn 服从标准正态分布 N(0,1)N(0,1)
则统计量 χ2=∑ni=1X2i∼χ2(n)χ2=∑ni=1X2i∼χ2(n)
f(x)=12n2Γ(n2)e−x2xn2−1f(x)=12n2Γ(n2)e−x2xn2−1,x>0x>0
性质
(i) E(χ2(n))=n,D(χ2(n))=2nE(χ2(n))=n,D(χ2(n))=2n
(ii)若 X1∼χ2(n1),X2∼χ2(n2)X1∼χ2(n1),X2∼χ2(n2) 且 X1,X2X1,X2 相互独立,那么 X1+X2∼χ2(n1+n2)X1+X2∼χ2(n1+n2)
(iii)n→∞n→∞,χ2(n)→χ2(n)→正态分布
(2)t(n)t(n)分布(nn为自由度)
设 X∼N(0,1),Y∼χ2(n)X∼N(0,1),Y∼χ2(n),X,YX,Y 相互独立
则统计量 T=X√Y/n∼t(n)T=X√Y/n∼t(n) 为 tt 统计量,其分布称为自由度为 nn 的 tt 分布
其密度函数为 f(t)=Γ(n+12)√nπΓ(n2)(1+t2n)−n+12f(t)=Γ(n+12)√nπΓ(n2)(1+t2n)−n+12,−∞<t<+∞−∞<t<+∞,过程略,用雅可比行列式是可以求出来的
性质
(i)fn(t)fn(t) 是偶函数
(ii)n→∞n→∞,fn(t)→fn(t)→ 标准正态分布
记 tt 的分位数为 tα(n)tα(n)
(iii)t1−α(n)=−tα(n)t1−α(n)=−tα(n)
(iiii)n很大,tα≈uαtα≈uα
(3)F(n,m)F(n,m)分布(nn、mm分别为第一、二自由度)
设 X∼χ2(n),Y∼χ2(m)X∼χ2(n),Y∼χ2(m),X,YX,Y 相互独立,则称:
F=X/nY/m∼F(n,m)F=X/nY/m∼F(n,m)
为 FF 统计量,其分布称为第一、二自由度为 nn、mm 的 FF 分布
其密度函数为
证明用雅可比行列式
性质
(i)若 F∼F(n,m)F∼F(n,m),则 1F∼F(m,n)1F∼F(m,n)
记 F(n,m)F(n,m) 分布的上侧分位数为 Fα(n,m)Fα(n,m)
(ii)F1−α(n,m)=1Fα(m,n)F1−α(n,m)=1Fα(m,n)
正态总体之样本均值于样本方差的一些结论
设总体 X∼N(μ,σ2)X∼N(μ,σ2),样本为 (X1,…,Xn)(X1,…,Xn)
则样本均值
结论1
¯X∼N(μ,σ2n)¯¯¯¯¯X∼N(μ,σ2n),即 ¯X−μσ/√n∼N(0,1)¯¯¯¯¯X−μσ/√n∼N(0,1)
同时有:
结论2
(n−1)S2σ2=∑ni=1(X−¯Xσ)2∼χ2(n−1)(n−1)S2σ2=∑ni=1(X−¯¯¯¯¯Xσ)2∼χ2(n−1)
结论3
(n−1)S2σ2(n−1)S2σ2 与 ¯X¯¯¯¯¯X 相互独立(或 S2S2 与 ¯X¯¯¯¯¯X 相互独立)
证明2、3
令 Zi=Xi−μσZi=Xi−μσ,则 Z1,Z2,…,Zn∼N(0,1)Z1,Z2,…,Zn∼N(0,1),且互相独立
而 ¯Z=1n∑ni=1Zi=¯X−μσ¯¯¯¯Z=1n∑ni=1Zi=¯¯¯¯¯X−μσ
(n−1)S2σ2=∑ni=1(Xi−¯X)2σ2=∑ni=1(Zi−¯Z)2=∑ni=1Z2i−n¯Z2(n−1)S2σ2=∑ni=1(Xi−¯¯¯¯¯X)2σ2=∑ni=1(Zi−¯¯¯¯Z)2=∑ni=1Z2i−n¯¯¯¯Z2
取正交矩阵 A=(ai,j)A=(ai,j),其中 a1,j=1√na1,j=1√n
令 Y=AZY=AZ
由于 Yi=∑nj=1ai,jZjYi=∑nj=1ai,jZj,故 Y1,Y2,…,Yn∼N(0,1)Y1,Y2,…,Yn∼N(0,1),且有 E(Yi)=0E(Yi)=0
又由 cov(Zi,Zj)=[i=j]cov(Zi,Zj)=[i=j],及 AA 正交,有:
于是,Y1,…,YnY1,…,Yn 相互独立(这里有点奇怪,cov=0cov=0 不代表独立,可能是 YY 生成方式导致的)
而 Y1=∑j=1a1,jZj=√n¯Z=√n¯X−μσY1=∑j=1a1,jZj=√n¯¯¯¯Z=√n¯¯¯¯¯X−μσ
且 ∑Y2i=YTY=ZTATAZ=ZTZ=∑Z2i∑Y2i=YTY=ZTATAZ=ZTZ=∑Z2i
故 (n−1)S2σ2=∑ni=1Z2i−n¯Z2=∑ni=1Y2i−Y21∼χ2(n−1)(n−1)S2σ2=∑ni=1Z2i−n¯¯¯¯Z2=∑ni=1Y2i−Y21∼χ2(n−1)
¯X¯¯¯¯¯X 只和 Y1Y1 有关,S2S2 只和 Y2,…,YnY2,…,Yn 有关,因此相互独立
结论4
设 X1,…,Xn∼N(μ1,σ21)X1,…,Xn∼N(μ1,σ21),Y1,…,Ym∼N(μ2,σ22)Y1,…,Ym∼N(μ2,σ22),且所有随机变量相互独立
令 S21=1n−1∑ni=1(Xi−¯X)2,S22=1m−1∑mi=1(Yi−¯Y)2S21=1n−1∑ni=1(Xi−¯¯¯¯¯X)2,S22=1m−1∑mi=1(Yi−¯¯¯¯Y)2
则 (n−1)S21σ21∼χ2(n−1)(n−1)S21σ21∼χ2(n−1),(m−1)S22σ22∼χ2(m−1)(m−1)S22σ22∼χ2(m−1)
且相互独立,从而
结论5
结论6
若 σ1=σ2=σσ1=σ2=σ,则有
标准化:
又
且相互独立,根据 χ2(n)χ2(n) 的可加性,有:
而由结论3可知 ¯X−¯Y¯¯¯¯¯X−¯¯¯¯Y 和 (n−1)S21σ2+(m−1)S22σ2(n−1)S21σ2+(m−1)S22σ2 相互独立,因此:
化简一下:
点估计
总体 XX 的分布函数的形式已知,但含有 kk 个位置参数 θ1,…,θkθ1,…,θk,基于总体的一个样本 X1,…,XnX1,…,Xn,构造 kk 个统计量,ˆθ1(X1,…,Xn),ˆθ2(X1,…,Xn),…,ˆθk(X1,…,Xn)^θ1(X1,…,Xn),^θ2(X1,…,Xn),…,^θk(X1,…,Xn) 作为 θ1,θ2,…,θnθ1,θ2,…,θn 的估计
(1)矩估计
用矩来估计,计算样本 (X1,…,Xn)(X1,…,Xn) 的 rr 阶矩 Ar=1n∑ni=1XriAr=1n∑ni=1Xri,对每个 r=1,2,…,kr=1,2,…,k
列出方程 μr(ˆθ1,ˆθ2,…,ˆθk)=1n∑ni=1Xriμr(^θ1,^θ2,…,^θk)=1n∑ni=1Xri,r=1,2,…,kr=1,2,…,k
kk 个未知数 kk 个方程,可以解出 (ˆθi)(^θi)
(2)极大似然估计
设总体 XX 的概率密度函数为 f(x;θ)f(x;θ)
对于总体 XX 的随机样本 (X1,…,Xn)(X1,…,Xn),其联合密度函数为:
当样本 (X1,…,Xn)(X1,…,Xn) 观测值 x1,…,xnx1,…,xn 给定时,L(x1,…,xn)L(x1,…,xn) 退变为 θθ 的函数,记为 L(θ)L(θ),称 L(θ)L(θ) 为样本的似然函数
极大似然估计就是选择适当的 θθ,使 L(θ)L(θ) 取到最大值
这样得到的 ˆθ=g(x1,x2,…,xn)^θ=g(x1,x2,…,xn) 为参数 θθ 的极大似然估计值
称相应的统计量 ˆθ=g(X1,X2,…,Xn)^θ=g(X1,X2,…,Xn) 为参数 θθ 的极大似然估计量
多个待估参数量的情形是同理的
如果似然函数关于变量 θ1,…,θkθ1,…,θk 可微,那么可以列方程组(偏导为0),得到极大似然估计
估计量的评价
无偏性
设 (X1,…,Xn)(X1,…,Xn) 是 XX 的样本,ˆθ(X1,…,Xn)^θ(X1,…,Xn) 是总体参数 θθ 的估计量,如果 E(ˆθ)=θE(^θ)=θ,则称 ˆθ^θ 是 θθ 的无偏估计量
S2S2 是 σ2σ2 的无偏估计量,易证
SS 不是 σσ 的无偏估计量,这个证明有点复杂,结论是 S√2Γ(n2)√n−1Γ(n−12)S√2Γ(n2)√n−1Γ(n−12) 是 σσ 的无偏估计量
有效性
如果 ˆθ1^θ1 和 ˆθ2^θ2 都是 θθ 的无偏估计量,如果 D(ˆθ1)<D(ˆθ2)D(^θ1)<D(^θ2),则称 ˆθ1^θ1 比 ˆθ2^θ2 更有效
一致性
当 n→∞n→∞,ˆθ^θ 依概率收敛于 θθ,称 ˆθ^θ 是总体参数 θθ 的一致估计量
关于一致性的常用结论
(i)样本 kk 阶矩是总体 kk 阶矩的一致估计量(由大数定律可得)
(ii)无偏估计量 ˆθ^θ 趋于无穷时方差为 00,则 ˆθ^θ 是 θθ 的一致估计量(切比雪夫不等式)
矩估计法得到的估计量一般为一致估计量
区间估计
对待估未知参数,不是一个量来估计,而是两个量(值)确定一个范围,即一个区间,来估计
置信区间与置信度
对于一个给定的数 αα,0<α<10<α<1
构造两个量 ˆθ1(X1,…,Xn)^θ1(X1,…,Xn) 和 ˆθ2(X1,…,Xn)^θ2(X1,…,Xn),使得 P(ˆθ1<θ2)P(^θ1<θ2)
则称概率值 1−α1−α 为置信水平或置信度,称两统计量形成的区间 (ˆθ1,ˆθ2)(^θ1,^θ2) 是一个随机区间,称该随机区间为参数 θθ 的置信度为 1−α1−α 的置信区间,并分别称 ˆθ1,ˆθ2^θ1,^θ2 为置信下限和置信上限
置信区间求解的基本步骤
(1)寻找一个样本函数 g(X1,X2,…,Xn,θ)g(X1,X2,…,Xn,θ),称为枢轴量,它含有待估参数,不含其它未知参数,它的分布已知,且分布不依赖于待估参数
(2)对于给定置信度 1−α1−α,确定出常数 aa 和 bb,使得 P(a<g(X1,…,Xn)<b)=1−αP(a<g(X1,…,Xn)<b)=1−α
(3)由(2)的不等式解出关于 θθ 的置信上下限,ˆθ1^θ1 和 ˆθ2^θ2,即有 P(ˆθ1<θ<ˆθ2)=1−αP(^θ1<θ<^θ2)=1−α,即得到置信区间 (ˆθ1,ˆθ2)(^θ1,^θ2)
正态总体置信区间
考虑总体服从正态分布的情形,并分两种情况:
- 一个正态总体
- 两个正态总体
注:记 uα,tα(n),χ2α(n),Fα(n,m)uα,tα(n),χ2α(n),Fα(n,m) 分别为标准正态分布、t(n)t(n) 分布、χ2(n)χ2(n) 分布、F(n,m)F(n,m) 分布的 αα 下侧分位数
一个正态总体的情形:
(1)方差 σ2σ2 已知,μμ 的置信区间
取枢轴量 ¯X−μσ/√n∼N(0,1)¯¯¯¯¯X−μσ/√n∼N(0,1)
由 P(|¯X−μσ/√n|<u1−α2)=1−αP(|¯¯¯¯¯X−μσ/√n|<u1−α2)=1−α
得到置信区间 (¯X−u1−α2σ√n,¯X+u1−α2σ√n)(¯¯¯¯¯X−u1−α2σ√n,¯¯¯¯¯X+u1−α2σ√n)
(2)方差 σ2σ2 未知,μμ 的置信区间
取枢轴量 ¯X−μS/√n∼t(n−1)¯¯¯¯¯X−μS/√n∼t(n−1),置信区间略
(3) μμ 已知,方差 σ2σ2 的置信区间
取枢轴量
(4) μμ 未知,方差 σ2σ2 的置信区间
取枢轴量
接下来是两个正态总体的情形
(1) σ21,σ22σ21,σ22 已知,μ1−μ2μ1−μ2 的置信区间
取枢轴量
(2) σ21,σ22σ21,σ22 未知(但 σ21=σ22=σ2σ21=σ22=σ2),μ1−μ2μ1−μ2 的置信区间
取枢轴量
(3) σ21,σ22σ21,σ22 未知,n,m>50n,m>50,μ1−μ2μ1−μ2 的置信区间
取枢轴量
(4) σ21,σ22σ21,σ22 未知,但 n=mn=m,μ1−μ2μ1−μ2 的置信区间
令 Zi=Xi−YiZi=Xi−Yi,可以将它看作来自正态总体 Z∼N(μ1−μ2,σ21+σ22)Z∼N(μ1−μ2,σ21+σ22) 的样本
然后和一个正态总体的 μμ 的置信区间做法一样
(5)方差比 σ21σ22σ21σ22 的置信区间(μ1,μ2μ1,μ2 未知)
取枢轴量
(6)方差比 σ21σ22σ21σ22 的置信区间(μ1,μ2μ1,μ2 已知)
取枢轴量
非正态总体的置信区间
通过中心极限定理,即得到一个式子,nn 很大的时候服从正态分布
假设检验
显著性水平
构造拒绝域
对假设检验问题,若 WW 为样本空间的一个子集,设 (X1,…,Xn)(X1,…,Xn) 为样本,θθ 为原假设,对于一个小概率 α∈(0,1)α∈(0,1) 若 WW 满足:
则称 WW 构成了原假设的一个拒绝域,称 αα 为显著性水平,并称此由 WW 构成拒绝域的方法为显著性水平为 αα 的方法
假设检验步骤
根据实际问题,建立 H0H0 与 H1H1,在 H0H0 为真的情况下,选择合适的统计量 VV
根据 H1H1 确定出拒绝域的形式
检验样本是否落入拒绝域
得出结论,接受 H0H0 或 H1H1
两类错误概率及检验的评价准则
第一类错误
弃真,在 H0H0 为真的情况下,拒绝了 H0H0,错误概率通常记作 αα
第二类错误
纳伪,在 H0H0 为假的情况下,接受了 H0H0,错误概率通常记作 ββ
功效函数
设 θθ 为总体带推断的参数,对于一个具有拒绝域 WW 的检验 ττ,定义:
为该检验的功效函数(也记为 βWβW 或 βτβτ)
易见,功效函数,即样本落入拒绝域的概率,是总体分布的参数 θθ 的函数
基于功效函数概念,对于假设 H0:θ∈Θ0H0:θ∈Θ0,H1:θ∈Θ1H1:θ∈Θ1,分析犯两类错误的概率 α,βα,β:
当 θ∈Θ0θ∈Θ0 时,即 H0H0 为真,落入拒绝域即犯第一类错误的概率:α=β(θ)α=β(θ),(θ∈Θ0)(θ∈Θ0)
当 θ∈Θ1θ∈Θ1 时,即 H1H1 为真,落入拒绝域之外即犯第二类错误的概率:β=1−β(θ)β=1−β(θ),(θ∈Θ1)(θ∈Θ1)
一致最优检验
对于一个 αα,设 τ∗τ∗ 为一个水平为 αα 的检验,若对于一个水平为 αα 的检验 ττ,都有 βτ∗(θ)≥βτ(θ),∀θ∈Θ1βτ∗(θ)≥βτ(θ),∀θ∈Θ1
称 τ∗τ∗ 为一致最优检验,记为 UMP 检验(uniformly most powerfule test)
UMP 检验,在第一个错误控制在 αα 内的情况下,总使第二类错误概率达到最小
无偏检验
对于假设 H0:θ∈Θ0H0:θ∈Θ0,H1:θ∈Θ1H1:θ∈Θ1,ττ 为一检验,其功效为 β(θ)β(θ)
若对任意 θ0∈Θ0θ0∈Θ0 及 θ1∈Θ1θ1∈Θ1,都有:
则称 ττ 为一个无偏检验
即,要求一个检验犯第一类错误的概率总不超过不犯第二类错误的概率
正态总体的假设检验(参数检验)
几乎与置信区间内容相同
总体分布的假设检验(非参数检验)
χ2χ2 检验法
设完备事件组 A1,…,AkA1,…,Ak,原假设 H0:P(Ai)=pi,i=1,2,…,kH0:P(Ai)=pi,i=1,2,…,k
进行 nn 次独立重复试验,事件出现的频数分别为 v1,…,vkv1,…,vk
定理(Pearson):若假设 H0H0 成立,则当 n→∞n→∞ 时,
趋于 χ2(k−r−1)χ2(k−r−1) 分布,其中 rr 是用最大似然估计的未知参数个数
Pearson χ2χ2 检验:拒绝域 V>χ21−α(k−r−1)V>χ21−α(k−r−1)
偏度、峰度检验法
设 G1=B3/B3/22G1=B3/B3/22(称为样本偏度)
设 G2=B4/B22G2=B4/B22(称为样本峰度)
若总体 XX 为正态变量,则可证:
当 nn 充分大时,近似地有 G1∼N(0,σ21)G1∼N(0,σ21),G2∼N(μ2,σ22)G2∼N(μ2,σ22),其中
方差分析
单因素方差分析(实验次数相等)
设因子 AA 有 mm 个水平,分别记为 A1,…,AmA1,…,Am,在每一种水平下,均进行 kk 次试验,每次试验可记为 Xi,jXi,j,观察值为 xi,jxi,j
为了方便,进一步假定这些总体为正态总体且具有相同的方差,于是:
原问题:考察因子 AA 对试验结果是否有显著影响
转化为:同方差总体(正态)期望是否相同
设 εiεi 是因子 AA 的第 ii 个水平 AiAi 所引起的差异:εi=μi−μεi=μi−μ 称为水平 AiAi 的效应,其中 μ=1m∑mi=1μiμ=1m∑mi=1μi 称为均值(期望)的总平均
相当于假设检验 H0:μ1=μ2=⋯=μH0:μ1=μ2=⋯=μ 或 H0:ε1=ε2=⋯=0H0:ε1=ε2=⋯=0
假设检验是第一个任务,第二个任务是对 μ1,…,μm,σ2μ1,…,μm,σ2 进行参数估计
水平 AiAi 下的样本均值(又称为组内平均值)
数据总平均
总离差平方和
在假设 H0H0 成立时,ST∼χ2(mk−1)ST∼χ2(mk−1)
事实上,ST=(mk−1)S2ST=(mk−1)S2,其中 S2S2 是总样本方差
误差平方和
反应组内(在同一水平下)样本的随机波动
效应平方和(组间平方和)
在一定程度上反应由组间(因子各个水平之间)不同引起的差异
平方和分解公式
ST=SA+SeST=SA+Se
这是因为:
同时:
结合一下就证明了
检验统计量
注意到:
和
因此检验统计量:
平方和分解定理(证略)
设 QQ 服从自由度为 nn 的 χ2χ2 分布,又
其中 QiQi 是秩为 fifi 的非负二次型,则 QiQi 互相独立且分布服从自由度为 fifi 的 χ2χ2 分布的充要条件是:
单因素方差分析(实验次数不等)
与相等的类似,检验统计量
平方和的计算
令 Ti=∑nij=1xi,jTi=∑nij=1xi,j,CT=n¯x2=1n(∑mi=1Ti)2CT=n¯¯¯x2=1n(∑mi=1Ti)2
则
双因子方差分析(双因子间无交互作用)
设 A,BA,B 是两个因子,A1,…,AnA1,…,An 是 AA 的 nn 个水平,B1,…,BmB1,…,Bm 是 BB 的 mm 个水平
实验结果以 Xi,jXi,j 表示,其观察值为 xi,jxi,j,假定在每种组合下实验结果 Xi,jXi,j 满足 N(μi,j,σ2)N(μi,j,σ2)
并设满足如下定义的效应可加性:μi,j=μ+αi+βjμi,j=μ+αi+βj,其中 αiαi 为因子水平 AiAi 的效应,βjβj 为因子水平 BjBj 的效应
于是,与单因素方差分析类似,可作问题转化:判定 A,BA,B 两因子对试验指标的影响是否显著的问题
相当于检验一下假设:H0:μ1,1=μ1,2=⋯=μi,j=⋯=μn,mH0:μ1,1=μ1,2=⋯=μi,j=⋯=μn,m
一些统计量的定义
数据总平均:
水平 AiAi 的组内平均值:
水平 BjBj 的组内平均值:
总离差平方和:
因子 AA 效应平方和(组间):
因子 BB 效应平方和(组间):
误差平方和(组内):
与单因素方差分析类似,可得如下分解公式:
检验统计量
平方和计算
双因子方差分析(双因子间有交互作用)
每个 AiAi 和 BjBj 都要做 rr 次,设为 Xi,j,k∼N(μi,j,k,σ2)Xi,j,k∼N(μi,j,k,σ2)
并设有 μi,j,k=μ+αi+βj+γi,jμi,j,k=μ+αi+βj+γi,j
判定有无显著影响的问题转化为检验假设 H0:μi,j,k=0,∀i,j,kH0:μi,j,k=0,∀i,j,k
(这里还有一堆,先略了)
回归分析
一元线性回归模型
样本点 (xi,yi)(xi,yi),i=1,2,…,ni=1,2,…,n
其中,变量间的线性相关的关系可用如下数学关系式表示:Y=a+bx+εY=a+bx+ε,其中 ε∼N(0,σ2)ε∼N(0,σ2)
待定常数 a,ba,b 称为模型参数,即回归系数,且 a,b,σ2a,b,σ2 均不依赖于 xx
回归系数的极大似然估计
为了方便,引入如下统计量:
由于 Y=a+bx+εY=a+bx+ε,有 Yi∼N(a+bx,σ2)Yi∼N(a+bx,σ2),则似然函数
极大化这个似然函数
对 aa 和 bb 的偏导是 00,解得 ˆa=¯y−b¯x,ˆb=SxySxx^a=¯¯¯y−b¯¯¯x,^b=SxySxx
最小二乘法
求解 ˆa,ˆb^a,^b,使得 ∑ni=1(yi−a−bxi)2=Q(a,b)∑ni=1(yi−a−bxi)2=Q(a,b) 最小
求偏导解得 ˆa,ˆb^a,^b 与极大似然相同
回归方程的显著性检验
相关系数检验法
令
其中 Q=∑ni=1δ2i=∑ni=1(yi−ˆyi)2Q=∑ni=1δ2i=∑ni=1(yi−^yi)2
假设检验 H0:r=0H0:r=0,检验统计量
当 |t|>t1−α2(n−2)|t|>t1−α2(n−2),拒绝原假设,认为存在线性关系,否则接受原假设,认为不存在线性关系
FF 检验法
假设检验 H0:b=0H0:b=0,检验统计量
其中 U=∑ni=1(ˆyi−¯y)2=S2xySxxU=∑ni=1(^yi−¯¯¯y)2=S2xySxx
课后验证:Syy=U+QSyy=U+Q
相关性质
在 H0:b=0H0:b=0 或 H0:r=0H0:r=0 之下,有
且 QQ 与 UU 独立
而 F=t2=(n−2)UQ∼F(1,n−2)F=t2=(n−2)UQ∼F(1,n−2)
多元线性回归
Y=b0+b1x1+⋯+bkxk+εY=b0+b1x1+⋯+bkxk+ε,常设 ε∼N(0,σ2)ε∼N(0,σ2)
最小二乘法
Q=∑ni=1(yi−ˆyi)2Q=∑ni=1(yi−^yi)2 对每个 bibi 求偏导令其为 00
本文来自博客园,作者:xay5421,转载请注明原文链接:https://www.cnblogs.com/xay5421/p/18249354
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· Obsidian + DeepSeek:免费 AI 助力你的知识管理,让你的笔记飞起来!
· 分享4款.NET开源、免费、实用的商城系统
· 解决跨域问题的这6种方案,真香!
· 一套基于 Material Design 规范实现的 Blazor 和 Razor 通用组件库
· 5. Nginx 负载均衡配置案例(附有详细截图说明++)