Typesetting math: 61%

概率统计A 知识总结

(搬运自 作业部落 ,不知道为啥到博客园上公式渲染全乱了)

前五章 概率论部分

概率

事件的交并差(跟集合运算差不多),条件概率 P(AB)=P(A)P(BA)P(AB)=P(A)P(BA) ,相互独立 P(AB)=P(A)P(B)P(AB)=P(A)P(B)

"n次抽取,放回与不放回"问题:不论放回与否,第 n 次抽中红球的概率都和第一次一样。(用全概率来推)

例:r 个红球 b 个黑球,每次抽一个,然后补充 c 个与抽中颜色相同的球,问第 n 次抽中红球的概率
(答案是 rr+brr+b ,与 n 和 c 无关,可以用归纳法,由全概率公式去递推)

看一下全概率公式,还有贝叶斯公式。(全概率比较好理解,贝叶斯最好看一下免得突然考)

随机变量

离散型随机变量,连续型随机变量。

牢记一下分布函数的概念: FX(x)=P{Xx}FX(x)=P{Xx} 。有时候求分布函数要从概率意义出发用定义来求。
(2020考研题,双路独立 X1,X2N(0,1)X1,X2N(0,1), MUX(X3X3,服从二点分布)选出一路, Y=X3X1+(1X3)X2Y=X3X1+(1X3)X2 ,求 (X1,Y)(X1,Y) 分布函数以及证明 YN(0,1)YN(0,1)

分布函数的性质:单调不减,F()=0F()=0F(+)=1F(+)=1.

分布律(分布列),概率密度函数。

二维联合分布函数:FXY(x,y)=P{Xx,Yy}FXY(x,y)=P{Xx,Yy}
联合分布(函数),边沿分布(函数);联合密度函数,边沿密度函数;条件分布函数/条件分布律/条件概率密度。

联合分布函数:FXY(x,y)FXY(x,y)F(x,y)F(x,y);边沿分布函数:FX(x)FX(x)FY(y)FY(y);联合密度函数fXY(x,y)fXY(x,y)f(x,y)f(x,y);边沿密度函数:fX(x)fX(x)fY(y)fY(y)

边沿与联合的关系:FX(x)=F(x,+)FX(x)=F(x,+), FY(y)=F(+,y)FY(y)=F(+,y)fX(x)=+f(x,y)dyfX(x)=+f(x,y)dyfY(y)=+f(x,y)dxfY(y)=+f(x,y)dx .

条件分布律: P{Y=jX=i}=P{X=i,Y=j}P{X=i}P{Y=jX=i}=P{X=i,Y=j}P{X=i}P{X=iY=j}=P{X=i,Y=j}P{Y=j}P{X=iY=j}=P{X=i,Y=j}P{Y=j}
条件分布函数: FXY(xy)FXY(xy) ; FYX(yx)FYX(yx) ;(注意这是个极限,书P84)
条件概率密度:条件Y=yY=yXXfXY(xy)=f(x,y)fY(y)fXY(xy)=f(x,y)fY(y),需要fY(y)0fY(y)0;反过来fYX(yx)=f(x,y)fX(x)fYX(yx)=f(x,y)fX(x) ;

符号XYXY表示:在Y=yY=y的条件下XX的条件(分布律/分布函数/概率密度)。注意"在Y=yY=y条件下"暗含P{Y=y}0P{Y=y}0fY(y)0fY(y)0的限制。

相互独立:FX(x)FY(y)=FXY(x,y)FX(x)FY(y)=FXY(x,y)fX(x)fY(y)=fXY(x,y)fX(x)fY(y)=fXY(x,y)。(密度函数乘积只需"几乎处处相等")

多个随机变量的函数的独立:若X1,X2,X3,X4X1,X2,X3,X4相互独立,则Y1=f(X1,X2)Y1=f(X1,X2)Y2=g(X3,X4)Y2=g(X3,X4)相互独立(两个式子不共用相同的随机变量,就可以相互独立)
X1N(0,1)X1N(0,1)X2N(0,1)X2N(0,1),且X1,X2X1,X2相互独立,则X1+X2X1+X2X1X2X1X2相互独立

标准化随机变量X=XEXDXX=XEXDX,满足EX=0,DX=1EX=0,DX=1

正态分布

一维概率密度函数:N(μ,σ2)N(μ,σ2)

f(x)=1σ2πexp[(xμ)22σ2]f(x)=1σ2πexp[(xμ)22σ2]

标准正态分布N(0,1)N(0,1)密度函数:φ(x)=12πex22φ(x)=12πex22,分布函数Φ(x)=12πxet22dtΦ(x)=12πxet22dt
Φ(x)Φ(x)表示标准正态分布的分布函数,可以直接写)

标准正态分布分位点:下侧分位点 zα=Φ1(α)zα=Φ1(α)P\left{ X\le z_{\alpha} \right} =\alphaP\left{ X\le z_{\alpha} \right} =\alpha ;上侧分位点 z1α=zαz1α=zαP\left{ X>z_{1-\alpha} \right} =\alphaP\left{ X>z_{1-\alpha} \right} =\alpha双侧分位点 z1α2z1α2P\left{ \left| X \right|>z_{1-\frac{\alpha}{2}} \right} =\alpha ,P\left{ \left| X \right|\le z_{1-\frac{\alpha}{2}} \right} =1-\alphaP\left{ \left| X \right|>z_{1-\frac{\alpha}{2}} \right} =\alpha ,P\left{ \left| X \right|\le z_{1-\frac{\alpha}{2}} \right} =1-\alpha

欧拉泊松积分: +ex2dx=π+ex2dx=π

数字特征:EX=μEX=μDX=σ2DX=σ2EX2=μ2+σ2EX2=μ2+σ2
中心2k阶矩(XN(μ,σ2)XN(μ,σ2)):E((Xμ)2k)=σ2k(2k1)!!E((Xμ)2k)=σ2k(2k1)!!,例如E((Xμ)6)=15σ6E((Xμ)6)=15σ6

正态分布的绝对值:对于Y=|Xμ|Y=|Xμ|XN(μ,σ2)XN(μ,σ2),其概率密度函数f(y)={2σπexp(y22σ2)x00x<0f(y)={2σπexp(y22σ2)x00x<0
(原本的密度函数只保留一边且翻倍),其数字特征可以记住:$EY=\sqrt{\frac{2}{\pi}}\sigma DY=\left( 1-\frac{2}{\pi} \right) \sigma ^2$ .
中心2k+1阶绝对矩(XN(μ,σ2)XN(μ,σ2)):E|Xμ|2k+1=2πσ2k+1(2k)!!E|Xμ|2k+1=2πσ2k+1(2k)!!

二维正态分布:(X,Y)N(μ1,σ21;μ2,σ22;ρ)(X,Y)N(μ1,σ21;μ2,σ22;ρ)。其中ρρ为相关系数。

f(x,y)=12πσ1σ21ρ2exp{12(1ρ2)[(xμ1σ1)22ρxμ1σ1yμ2σ2+(yμ2σ2)2]}f(x,y)=12πσ1σ21ρ2exp{12(1ρ2)[(xμ1σ1)22ρxμ1σ1yμ2σ2+(yμ2σ2)2]}

密度函数不好背可以记其矩阵形式:(n维正态分布)

f(x)=1(2π)n2|C|exp[12(xμ)TC1(xμ)]f(x)=1(2π)n2|C|exp[12(xμ)TC1(xμ)]

式子中,xx为随机列向量,μμ为期望列向量,CC为协方差矩阵。

(对于二维)其中 $\boldsymbol{x}=\left( x1 x2 x1 x2  \right) \boldsymbol{\mu }=\left( μ1 μ2 μ1 μ2  \right) \boldsymbol{C}=\left( σ21ρσ1σ2 ρσ1σ2σ22 σ21ρσ1σ2 ρσ1σ2σ22  \right) \boldsymbol{C}^{-1}=\frac{1}{\left| \boldsymbol{C} \right|}\left( σ22ρσ1σ2 ρσ1σ2σ21 σ22ρσ1σ2 ρσ1σ2σ21  \right) \left| \boldsymbol{C} \right|=\sigma _{1}^{2}\sigma _{2}^{2}\left( 1-\rho ^2 \right) $ 。

正态分布的性质:

  1. 线性性质,正态分布的线性组合仍然是正态分布,期望和方差分别按照各自的性质。
  2. 在正态分布中"独立"等价于"不相关",即ρ=0ρ=0

几种常见的随机变量分布

离散型随机变量
  • 两点分布(0-1分布)
  • 二项分布(伯努利分布)

XB(n,p)XB(n,p)P{X=k}=CknpkqnkP{X=k}=CknpkqnkEX=npEX=npDX=npqDX=npq。其中q=1pq=1pk=0,1,,nk=0,1,,n
要会计算E(etX)E(etX)(etketkpkpk合并,二项式定理),参考结果:(pet+q)n(pet+q)n (18-19,16-17往年题里均有)

求和性质:B(n1,p)+B(n2,p)B(n1+n2,p)B(n1,p)+B(n2,p)B(n1+n2,p)

  • 泊松分布

XΠ(λ)XΠ(λ)P{X=k}=eλλkk!P{X=k}=eλλkk!EX=DX=λEX=DX=λ。其中k=0,1,k=0,1,
与二项分布关系:当n很大p很小时,λ=npλ=np用于逼近二项分布。

求和性质:Π(λ1)+Π(λ2)Π(λ1+λ2)Π(λ1)+Π(λ2)Π(λ1+λ2)

  • 超几何分布

正品MM件,次品NN件,从中取nn件,正品数量kk件:P{X=k}=CkNCnkMCnM+NP{X=k}=CkNCnkMCnM+N。其中k=0,1,,min{M,n}k=0,1,,min{M,n} .
(公式不要记,用古典概型-事件空间角度理解,自己推)
注意看清N是总数还是次品!(黑球白球问题同理)

数学期望:NN为次品数则EX=nMM+NEX=nMM+NNN为总数则EX=nMNEX=nMN

连续型随机变量
  • 正态分布
  • 均匀分布
  • 指数分布

概率密度函数:f(x)={λeλxx00x<0f(x)={λeλxx00x<0,分布函数F(x)={0x<01eλxx0F(x)={0x<01eλxx0

数字特征:EX=1λEX=1λDX=1λ2DX=1λ2

随机变量函数的分布

离散型没什么好说的,列出分布列然后合并同类项就可以。

连续型主要是找对积分区间,对自变量的概率密度求积分,得到因变量的分布函数。先有分布函数再求导就可以得到概率密度函数。
即:FY(y)=Yyf(x)dxFY(y)=Yyf(x)dxFZ(z)=Zzf(x,y)dxdyFZ(z)=Zzf(x,y)dxdy

P105定理:一维随机变量XX,密度函数f(x)f(x)Y=g(X)Y=g(X)gg单调函数,则

fY(y)={f(x)|h(y)|yI0OtherfY(y)={f(x)|h(y)|yI0Other

其中hhgg的反函数,有X=h(Y)X=h(Y)
应用上述定理时gg必须是单调函数。如果是分段单调也可分割区间分别处理。

绝对值Y=|X|Y=|X|,对于正态分布,其概率密度函数变两倍,只取右边。

几个二维随机变量函数的分布(P111-114)

  • Z=X+YZ=X+Y (主要还是理解过程,记公式意义不大)

P{Zz}=P{X+Yz}P{Zz}=P{X+Yz},积分区域为直线y=zxy=zx以下的区域。如果是无穷区域,用y=zxy=zx换元后Fubini换序积分,得fZ(z)=+f(x,zx)dxfZ(z)=+f(x,zx)dx ,此积分可转化为曲线积分fZ(z)=¯ABf(x,y)dxfZ(z)=¯¯¯¯¯¯¯¯ABf(x,y)dx 计算,其中直线¯AB:x+y=z¯¯¯¯¯¯¯¯AB:x+y=z 沿xx增加的方向。同理fZ(z)=+f(zy,y)dy=¯BAf(x,y)dyfZ(z)=+f(zy,y)dy=¯¯¯¯¯¯¯¯BAf(x,y)dy
对于有限区域直接(分段)算二重积分或者曲线积分就行,不用背公式。

  • Z=max{X,Y}Z=max{X,Y}

P{Zz}=P{Xz,Yz}P{Zz}=P{Xz,Yz}
分布函数Fmax(z)=FXY(z,z)Fmax(z)=FXY(z,z),对于n个独立同分布变量,Fmax(z)=[F(z)]nFmax(z)=[F(z)]n

  • Z=min{X,Y}Z=min{X,Y}

P{Zz}=P{XzYz}P{Zz}=P{XzYz}
分布函数Fmin(z)=FX(z)+FY(z)FXY(z,z)Fmin(z)=FX(z)+FY(z)FXY(z,z),对于n个独立同分布变量,Fmin(z)=1[1F(z)]nFmin(z)=1[1F(z)]n

随机变量的数字特征

  • 期望和方差:单个随机变量
  • 协方差和相关系数,协方差矩阵:两个或多个随机变量的关系

随机变量的期望:连续型E(X)=+xfX(x)dxE(X)=+xfX(x)dx,离散型E(X)=kkP{X=k}E(X)=kkP{X=k} .

随机变量函数的期望:连续型 E[g(X)]=+g(x)fX(x)dxE[g(X)]=+g(x)fX(x)dx,离散型 E\left[g(X)\right]=\sum_k g(k)P \left{ X=k \right}E\left[g(X)\right]=\sum_k g(k)P \left{ X=k \right}
(直接在期望公式中把X替换即可,概率/概率密度项不动。)

离散型随机变量函数的期望,计算时可能涉及级数(几何级数,泰勒级数,逐项积分/求导),二项式定理。

例:已知几何分布$P\left{X=k\right}=pq^{k-1}, k=1,2,\cdots; q=1-p E(e^{\text{i}tX})$。(几何级数)

解:E(eitX)=k=1eitkpqk1=eitpk=1eit(k1)qk1=peitk=0(qeit)k=peit11qeitE(eitX)=k=1eitkpqk1=eitpk=1eit(k1)qk1=peitk=0(qeit)k=peit11qeit .
其中最后一步依据为几何级数11x=k=0xk11x=k=0xk,收敛半径为1,而|qeit|=q<1qeit=q<1 在收敛域内。

例:已知二项分布XB(n,p)XB(n,p),求E(etX)E(etX)。(二项式定理)

解:E(etX)=nk=0Cknpkq1ketk=nk=0Ckn(pet)kq1k=(pet+q)nE(etX)=nk=0Cknpkq1ketk=nk=0Ckn(pet)kq1k=(pet+q)n

例:已知泊松分布XΠ(λ)XΠ(λ),证明期望EX=λEX=λ,且判断$E\left( \frac{1}{X+1} \right) \frac{1}{\lambda +1}e^x$的泰勒级数)

解:EX=eλk=0λkk!k=eλk=1λk(k1)!=λeλk=1λk1(k1)!=λeλk=0λkk!EX=eλk=0λkk!k=eλk=1λk(k1)!=λeλk=1λk1(k1)!=λeλk=0λkk!
$=\lambda e^{-\lambda}\cdot e^{\lambda}=\lambda exex=\sum_{n=0}{\infty}{\frac{xn}{n!}}E\left( \frac{1}{X+1} \right) =e{-\lambda}\sum_{k=0}\cdot \frac{1}{k+1}}=e{-\lambda}\sum_{k=0}{\left( k+1 \right) !}}=\frac{e{-\lambda}}{\lambda}\sum_{k=1}{\frac{\lambda k}{k!}}=\frac{e{-\lambda}}{\lambda}\cdot \left( e^{\lambda}-1 \right)=\frac{1}{\lambda}-\frac{e^{-\lambda}}{\lambda}$ ,
下面比较1λeλλ1λeλλ1λ+11λ+1的大小关系:1λ1λ+1=1λ(λ+1)1λ1λ+1=1λ(λ+1)eλλ=1λeλeλλ=1λeλ,由于λ>0λ>0eλ>λ+1eλ>λ+1 ,所以1λ(λ+1)>1λeλ1λ(λ+1)>1λeλ1λ1λ+1>eλλ1λ1λ+1>eλλ1λeλλ>1λ+11λeλλ>1λ+1,即E(1X+1)>1λ+1E(1X+1)>1λ+1 。(18-19上)

方差的计算公式:DX=E(XEX)2=EX2(EX)2DX=E(XEX)2=EX2(EX)2

期望的线性性质:
数乘 E(aX)=aEXE(aX)=aEX
相加 E(X+Y)=EX+EYE(X+Y)=EX+EY不需要相互独立),
线性组合 E(aX+bY+c)=aEX+bEY+cE(aX+bY+c)=aEX+bEY+c(不用独立)

乘积的期望E(XY)=EXEYE(XY)=EXEY(要求相互独立

方差性质:(并不保线性)
系数平方 D(aX)=a2DXD(aX)=a2DX
平移不变 D(X+C)=DXD(X+C)=DX
相加 D(X±Y)=DX+DYD(X±Y)=DX+DY(此时要求X,YX,Y相互独立
线性组合 D(aX+bY+c)=a2DX+b2DYD(aX+bY+c)=a2DX+b2DY (相互独立)

矩的概念

原点矩,中心矩;k阶矩;绝对矩;混合矩;

协方差

协方差定义:Cov(X,Y)=E[(XEX)(YEY)]Cov(X,Y)=E[(XEX)(YEY)]

计算公式:
用期望:Cov(X,Y)=E(XY)EXEYCov(X,Y)=E(XY)EXEY
用方差:D(X±Y)=DX+DY±2Cov(X,Y)D(X±Y)=DX+DY±2Cov(X,Y),(别忘了公式里有个2倍)

性质:
对称 Cov(X,Y)=Cov(Y,X)Cov(X,Y)=Cov(Y,X)
倍乘 Cov(aX,bY)=abCov(X,Y)Cov(aX,bY)=abCov(X,Y)
相加 Cov(X1+X2,Y)=Cov(X1,Y)+Cov(X2,Y)Cov(X1+X2,Y)=Cov(X1,Y)+Cov(X2,Y)
方差 Cov(X,X)=DXCov(X,X)=DX

相关系数

定义:ρ=Cov(X,Y)DXDYρ=Cov(X,Y)DXDY

表示两随机变量的线性相关程度,|ρ|1|ρ|1恒成立。ρρ是无量纲数。
ρ=1ρ=1:正线性;ρ=1ρ=1:负线性;ρ>0ρ>0:正相关;ρ<0ρ<0:负相关;ρ=0ρ=0:不相关。
注意:不相关不一定相互独立。反例:非矩形形状的均匀分布,不满足fXY(x,y)=fX(x)fY(y)fXY(x,y)=fX(x)fY(y)
对于正态分布ρ=0ρ=0 不相关即为相互独立。

代入标准化随机变量有:$\rho_{XY} =\text{Cov}\left( X{\ast},Y \right) $ 。

协方差矩阵

二维随机向量:$\boldsymbol{C}=\left( \begin{matrix}
\sigma _{1}^{2}& \rho \sigma _1\sigma _2\
\rho \sigma _1\sigma _2& \sigma {2}^{2}\
\end{matrix} \right) nnc
=\text{Cov}\left( X_i,X_j \right) $。

几个不等式

  • |E(XY)|(EX2)12(EY2)12|E(XY)|(EX2)12(EY2)12 ,(柯西-施瓦茨)
  • (E|X+Y|2)12(EX2)12+(EY2)12(E|X+Y|2)12(EX2)12+(EY2)12
  • |Cov(X,Y)|DXDY|Cov(X,Y)|DXDY
  • |P(AB)P(A)P(B)|{P(A)[1P(A)]}12{P(B)[1P(B)]}12|P(AB)P(A)P(B)|{P(A)[1P(A)]}12{P(B)[1P(B)]}12

六七八九章 数理统计部分

第六章

切比雪夫不等式

P{|XEX|ε}DXε2P{|XEX|ε}DXε2

导出形式:P{|XEX|<ε}1DXε2P{|XEX|<ε}1DXε2
意义:用二阶偏差"控制"一阶偏差。

大数定律

切比雪夫大数定律

一列相互独立的随机序列$X_1,X_2,\cdots ,X_n,\cdots Y_n=\frac{1}{n}\sum_{i=1}^n{X_i}=\bar{X}_nD\left( X_i \right) \le C\underset{n\to\infty}{\lim} DY_n=0\forall \varepsilon >\text{0, }\underset{n\rightarrow \infty}{\lim}P\left{ \left| Y_n-EY_n \right|<\varepsilon \right} =1$ 。

注:方差一致有界的条件可以放松,只要CCnn的低阶无穷大即可(limnCn=0limnCn=0)。

依概率收敛ε>0, limnP{|XnX|<ε}=1ε>0, limnP{|XnX|<ε}=1,记为XnPXXnPX

辛钦大数定律

{Xn}{Xn}独立同分布,EXi=μEXi=μDXi=σ2DXi=σ2,则limnP{|ˉXμ|<ε}=1limnP{¯Xμ<ε}=1ˉXPμ¯XPμ

伯努利大数定律

伯努利n次独立重复试验,nAnA表示事件A发生的次数,p为A发生的概率,则limnP{|nAnp|<ε}=1limnP{nAnp<ε}=1

中心极限定理

随机序列{Xn}{Xn}独立同分布,EXi=μEXi=μDXi=σ20DXi=σ20
Yn=ni=1XiYn=ni=1Xi,当n充分大时,近似地有:$Y_{n}^{\ast}\sim N\left( \text{0,}1 \right) Y_n\sim N\left( n\mu ,n\sigma ^2 \right) $ 。

棣莫弗-拉普拉斯定理

伯努利n次独立重复试验,μnμn表示事件A发生次数,p是事件A发生的概率,则[a,b][a,b]

limnP{a<μnnpnp(1p)b}=Φ(b)Φ(a)limnP{a<μnnpnp(1p)b}=Φ(b)Φ(a)

理解:由二项分布,Eμn=npEμn=npDμn=np(1p)Dμn=np(1p);由中心极限定理,μnN(0,1)μnN(0,1),即得上式。

一个便于记忆的形式:

P{N<μnM}Φ(M)Φ(N)P{N<μnM}Φ(M)Φ(N)

(其中M和N均为整数,代表一个"事件发生次数";μn=μnnpnp(1p)μn=μnnpnp(1p)N=Nnpnp(1p)N=Nnpnp(1p)
上面这个约等式也可以是单边概率,即NNM+M+

本部分题型主要参考课后题,一般就是用定理去估计一件事的概率,或者是给定概率求N之类的。

第七章 统计总体与样本

样本统计量

样本均值:ˉX=1nni=1Xi¯X=1nni=1Xi
样本方差:S2=1n1ni=1(XiˉX)2S2=1n1ni=1(Xi¯X)2,(注意分母是n1n1)!!!
(k阶原点、中心矩:Ak=1nni=1XkiAk=1nni=1XkiBk=1nni=1(XiˉX)kBk=1nni=1(Xi¯X)k)注意B2S2B2S2

样本统计量的数字特征:EˉX=μE¯X=μDˉX=σ2nD¯X=σ2nES2=σ2ES2=σ2。(任何分布的总体都可以)

样本统计量的分布(正态,卡方,t,F)

此处只针对正态总体。

四种分布
  • 正态分布,标准正态分布N(0,1)N(0,1)及其分位点(下侧:zαzα,双侧:z1α2z1α2
  • 卡方分布χ2(n)χ2(n)及其期望、方差、分位点χ2α(n)χ2α(n)

n路标准正态分布(XiN(0,1)XiN(0,1))之和服从自由度为n的卡方分布,ni=1X2iχ2(n)ni=1X2iχ2(n)
Xχ2(n)Xχ2(n),则EX=nEX=nDX=2nDX=2nχ2(n1)+χ2(n2)χ2(n1+n2)χ2(n1)+χ2(n2)χ2(n1+n2)

标准正态的平方是卡方分布:XN(0,1)XN(0,1)X2χ2(1)X2χ2(1)

  • t分布t(n)t(n)及其分位点(下侧:tα(n)tα(n),双侧:t1α2t1α2

形式:N(0,1)χ2(n)/nt(n)N(0,1)χ2(n)/nt(n),期望和方差不用知道。

  • F分布

形式:$\frac{\chi ^2\left( n_1 \right) /n_1}{\chi ^2\left( n_2 \right) /n_2}\sim F\left( n_1,n_2 \right) tFtFT\sim t(n)T^2\sim F(1,n)$)

统计量的分布

正态:$\bar{X}\sim N\left( \mu ,\frac{\sigma ^2}{n} \right) X_j-\bar{X}\sim N(0, \frac{n-1}{n}\sigma^2)\bar{X}^{\ast}=\frac{\bar{X}-\mu}{\sigma \sqrt{n}}\sim N\left( \text{0,}1 \right) X_{i}^{\ast}=\frac{X_i-\mu}{\sigma}\sim N\left( \text{0,}1 \right) $,

卡方:n1σ2S2χ2(n1)n1σ2S2χ2(n1)DS2=2σ4n1DS2=2σ4n1
一对自由度差异:ni=1(XiˉXσ)2χ2(n1)ni=1(Xi¯Xσ)2χ2(n1)ni=1(Xiμσ)2χ2(n)ni=1(Xiμσ)2χ2(n)。(用正态线性函数的结论)

t分布:ˉXμS/nt(n1)¯XμS/nt(n1)
$\frac{\left( \bar{X}-\bar{Y} \right) -\left( \mu 1-\mu 2 \right)}{\sqrt{\left( m-1 \right) S^{2}+\left( n-1 \right) S^{2}}}\cdot \sqrt{\frac{mn\left( m+n-2 \right)}{m+n}}\sim t\left( m+n-2 \right) \frac{\bar{X}-\bar{Y}-\left( \mu _1-\mu 2 \right)}{S_1\sqrt{\text{1/}n+\text{1/}m}}\sim t\left( m-1 \right) \sqrt{\frac{n}{n+1}}\frac{X-\bar{X}}{S}\sim t\left( n-1 \right) $

F分布:n(ˉXμ)2S2F(1,n1)n(¯Xμ)2S2F(1,n1)

对于正态总体 N(μ,σ2)N(μ,σ2) ,设其样本均值为 ˉX¯X ,样本方差为 S2S2 ,则有 ˉX¯XS2S2 相互独立。

参数的点估计

矩估计

一个参数:直接用EX。注意:^θ2^θ2如果能直接估计出来,不要先估计ˆθ^θ再平方,会有累积误差。

两个参数:$\left{ EX=ˉX DX=S2 EX=¯X DX=S2  \right. \left{ EX=ˉX DX=B2 EX=¯X DX=B2  \right. \left{ EX=ˉX EX2=A2 EX=¯X EX2=A2  \right. $都可以(第一种最好,第二种不是无偏估计)

极大似然估计

构造似然函数L(θ)L(θ),找到使得L(θ)L(θ)取最大值的ˆθ^θ。一般情况下令L(θ)=0L(θ)=0,也有特殊情况无法求导处理。

似然函数的构造:离散型 L(θ)=ni=1P{Xi=xi}L(θ)=ni=1P{Xi=xi},连续型 L(θ)=ni=1f(xi)L(θ)=ni=1f(xi)
(把所有样本的概率/概率密度全乘起来)

可以求导的典型例子:指数分布;不能求导的典型例子:均匀分布

常考的可以求导的形式:PeQPeQ,其中P,Q均为含xxθθ的仅乘除的式子(单项式或者分式),例如指数分布。

不能用求导的例子P203:f(x)={1θ0xθ0Othersf(x)={1θ0xθ0Others\hat{\theta}=\max \left{ x_1,\cdots ,x_n \right}\hat{\theta}=\max \left{ x_1,\cdots ,x_n \right}

点估计的优良性

  • 无偏估计:E(ˆθ)=θE(^θ)=θ
  • 最小方差无偏估计:D(ˆθ)D(^θ)最小
  • 一致估计(相合估计):ˆθPθ^θPθ。(用大数定律)

一些结论:(设总体期望为μμ,总体方差为σσ

  • ˉX¯Xμμ的无偏估计,也是最小方差线性无偏估计
  • S2S2σ2σ2的无偏估计,而B2B2不是无偏的。
  • 用样本的线性组合对总体无偏估计,系数越平均,方差越小
  • 正态总体的ˉX¯Xμμ的一致估计,S2S2σ2σ2的一致估计
  • 正态总体的方差:^σ2=1n1ni=1(XiˉX)2^σ2=1n1ni=1(Xi¯X)2(矩估计)和^σ2=1nni=1(Xiμ0)2^σ2=1nni=1(Xiμ0)2(极大似然)都是^σ2^σ2的无偏估计,后者更优。

区间估计与假设检验

我把这两块写到一起了,因为他们的本质和用到的方法都是一样的。

区间估计里的"置信概率":1α1α;假设检验里的"检验水平(显著性水平)":αα;这两者里的αα是等价的。

假设检验要按步骤写,写原假设和备择假设;选取检验用的统计量;确定检验水平和拒绝域;代入样本值检验。

假设检验的两类错误:错误拒绝H0(第一类),错误接受H0(第二类)。第一类错误的概率要会算(和αα有关)

大体上分为三类:知(总体)方差检验期望,未知方差检验期望,检验方差。(选取的统计量和分布不同)
每种检验/估计分为双边、左边、右边。(选取双侧分位点或下侧/上侧分位点)

  • 已知σ2σ2检验μ0μ0

选取的统计量:U=ˉXμ0σ/nU=¯Xμ0σ/n,服从的分布:N(0,1)N(0,1)

双侧假设检验:$P\left{ \left| U \right|>z_{1-\frac{\alpha}{2}} \right} =\alpha \mu\left[ \bar{x}-z_{1-\frac{\alpha}{2}}\frac{\sigma}{\sqrt{n}},\bar{x}+z_{1-\frac{\alpha}{2}}\frac{\sigma}{\sqrt{n}} \right]$。

左边检验(H1:μ<μ0H1:μ<μ0):$P\left{ U<-z_{1-\alpha} \right} =\alpha \left( -\infty ,\bar{x}+z_{1-\alpha}\frac{\sigma}{\sqrt{n}} \right] ..H_1:\mu>\mu_0P\left{ U>z_{1-\alpha} \right} =\alpha\left[ \bar{x}-z_{1-\alpha}\frac{\sigma}{\sqrt{n}},+\infty \right) $.

  • 未知σ2检验μ0

选取的统计量:T=ˉXμ0s/n,服从的分布:t(n1)。(注意自由度,是n-1)

双侧假设检验:$P\left{ \left| T \right|>t_{1-\frac{\alpha}{2}} \right} =\alpha \mu\left[ \bar{x}-t_{1-\frac{\alpha}{2}}\frac{s}{\sqrt{n}},\bar{x}+t_{1-\frac{\alpha}{2}}\frac{s}{\sqrt{n}} \right]$。

  • 检验σ2

选取的统计量:W=(n1)s2σ2,服从的分布:χ2(n1)。(注意自由度,是n-1)

双侧假设检验:$P\left{ W>\chi _{1-\frac{\alpha}{2}}^{2}\cup W<\chi _{\frac{\alpha}{2}}^{2} \right} =\alpha \sigma^2 \left[ \frac{\left( n-1 \right) s^2}{\chi _{1-\frac{\alpha}{2}}^{2}\left( n-1 \right)},\frac{\left( n-1 \right) s^2}{\chi _{\frac{\alpha}{2}}^{2}\left( n-1 \right)} \right]\sigma\left[ \sqrt{\frac{\left( n-1 \right) s^2}{\chi _{1-\frac{\alpha}{2}}^{2}\left( n-1 \right)}},\sqrt{\frac{\left( n-1 \right) s^2}{\chi _{\frac{\alpha}{2}}^{2}\left( n-1 \right)}} \right]$。

卡方这里分位点选取并不唯一,也可以选χ2123α,χ2α3,只要保证两个α的系数(的绝对值)加起来等于一就可以。(或者两个系数相减等于1α,本质一样)

此部分考试的注意要点

根据往年题经验,一般是考一个选择题,让判断一个随机变量(统计量)在某区间里的概率对不对。判断起来并不难,主要就是看选取的统计量和采用的分位点分布种类是否匹配。比如说如果统计量T搭配了正态分布分位点z1α2肯定是不对的。然后就是双侧分位点选取的灵活处理。题目有可能不是用的两边对称的1α2双侧分位点,这时候可以简单画图验证一下。
(正态分布和t分布都是单峰对称的,(,+),而卡方分布是单峰不对称的,(0,+)。)
先排除统计量与分布对应不上的,再看分位点选取是否正确。

最后三章 随机过程部分

随机过程

随机过程X(t),相当于"一族"随机变量,与样本和时间有关(X(e,t))。
样本(函数):固定e保留时间t变化,即x(t)=X(e0,t);是个关于t的函数
状态(变量):固定t保留样本e变化,即X(t1)=X(e,t1);是个随机变量

状态空间:{X(e,t)eS,tT},即X的值域。样本空间S={e};参数集T:参数t取值范围。

随机序列:参数t离散的情况,即{Xn}

n维分布函数;两个随机过程的有限维联合分布函数;要会写一维F1(x1;t1)和二维F2(x1,x2;t1,t2)

独立过程(任何n个状态都独立)

数字特征

单个过程
(对于二阶矩存在的过程,只要知道μRX就可以确定其他三个)

  • 期望:μX(t)=E[X(t)]

  • 二阶矩:Ψ2X(t)=E[X2(t)]Ψ2X(t)=RX(t,t)

  • 方差:σ2X(t)=D[X(t)]=Ψ2X(t)μ2X(t)σ2X(t)=CX(t,t)

  • 自相关函数:RX(t1,t2)=E[X(t1)X(t2)]

  • 自协方差:CX(t1,t2)=Cov(X(t1),X(t2))=RX(t1,t2)μX(t1)μX(t2)

两个过程

  • 互相关函数:RXY(t1,t2)=E[X(t1)Y(t2)]
  • 互协方差:CXY(t1,t2)=Cov(X(t1),Y(t2))=RXY(t1,t2)μX(t1)μY(t2)

两过程相互独立:RXY(t1,t2)=μX(t1)μY(t2)
任意时刻CXY(t1,t2)=0X(t)Y(t)不相关。

平稳过程

严平稳

条件:
(1)一维分布函数F(x1;t)=F(x1)不依赖于参数t;
(2)二维分布函数F(x1,x2;t1,t2)=F(x1,x2;τ)仅依赖于参数间距τ=t2t1

性质:
(1)μXΨ2Xσ2X与时间t无关;
(2)RX(τ)CX(τ)只与间距τ=t2t1有关,与t1的原点选取无关。

RX(τ)=E[X(t)X(t+τ)]

严平稳过程举例:伯努利序列

广义平稳

条件:
(1)原点二阶矩E[X2(t)]存在
(2)期望E[X(t)]=μX为常数
(3)自相关函数E[X(t)X(t+τ)]=RX(τ)只与τ有关,与t无关

性质:前三个数字特征都是常数;后两个数字特征只与间距有关。
σ2X=CX(0)Ψ2X=RX(0); RX(τ)CX(τ)均为偶函数.

平稳(时间)序列:参数t为整数或者可列;

两个平稳的关系:
严平稳+二阶矩存在=广义平稳;广义平稳不一定严平稳;严平稳不一定广义平稳(二阶矩不一定存在)

两个平稳过程之间的关系:
(1)联合平稳过程:E[X(t)Y(t+τ)]=RXY(τ);此时CXY(τ)=RXY(τ)μXμY
(2)标准互协方差:ρXY(τ)=CXY(τ)CX(0)CY(0),等于零时则两个平稳过程不相关。

注:检验(广义)平稳过程,一定要说明二阶矩E[Y2(t)]存在且有限(直接代RX(0)说明即可,但不能不写)!

正态(平稳)过程

正态过程:t都有X(t)服从正态分布;
正态序列;独立正态过程;

正态平稳过程:正态过程X(t)为(广义)平稳过程。

记个结论:正态过程X(t)其中t(,+),满足E[X(t)]=μX=0,则:

  1. 一维分布:X(t)N(0,RX(0))
  2. 二维分布:(X(t1),X(t2))N(0,RX(0);0,RX(0);RX(τ)RX(0)).

遍历过程

时间均值和时间相关函数的概念
  • 时间均值:¯X(t)=¯X(e,t)=liml+12lllX(e,t)dt,其中¯X(t)是个随机变量。
  • 时间相关函数:¯X(t)X(t+τ)=liml+12lllX(e,t)X(e,t+τ)dt,是一个关于τ的随机过程。

对于单边的情况(t>0,$\left{ X\left( t \right) ,t\in \left[ \text{0,}+\infty \right) \right} \frac{1}{2l}\int_{-l}l\frac{1}{l}\int_{0}l$即可。

平稳过程的各态遍历性
  • 均值的各态遍历性:P{¯X(t)=μX}=1
  • 自相关函数的各态遍历性:P{¯X(t)X(t+τ)=RX(τ)}=1

满足两个各态遍历性:遍历过程

确定遍历过程的数字特征:只需获得一个样本函数即可。

  • ˆμX=1ll0x(t)dtˆRX(τ)=1lτlτ0x(t)x(t+τ)dt

书上的例子:

  1. 随机相位正弦波X(t)=asin(ωt+Θ)ΘU[0,2π].
  2. 随机相位周期过程X(t)=S(t+Θ),周期为TΘU[0,T].

例4:平稳过程X(t)RX(τ)以T为周期,则tP{X(t+T)=X(T)}=1

不是遍历过程的平稳过程:X(t)=YY是个随机变量。

各态遍历性判别定理

给一个随机过程{X(t),tT}

  • 二阶矩过程:E[X2(t)]存在且有限.
  • 均方连续:t0Tlimtt0E|X(t)X(t0)|2=0.
    均方连续平稳过程的¯X(t)的期望和方差:
    E[¯X(t)]=E[X(t)]=μXD[¯X(t)]=liml+1l2l0(1τ2l)[RX(τ)μ2X]dτ.
  • 均值各态遍历定理:均方连续平稳过程,时间均值各态遍历性的充要条件:
    对于<t<+D[¯X(t)]=liml+1l2l0(1τ2l)[RX(τ)μ2X]dτ=0.
    对于0<t<+liml+1ll0(1τl)[RX(τ)μ2X]dτ=0.

随机正弦波的性质

随机正弦波基本形式:X(t)=Xcos(ωt+Θ),其中X,Θ都是随机变量(随机振幅,随机相位)或者常数。
(这里写成sin和cos都等价,书上都写的余弦,这里就写余弦了)

随机相位:

X(t)=acos(ωt+Θ)

其中Θ为随机变量,一般题目会给均匀分布ΘU[0,2π]U[π,π],也可能是其他的。

  • 期望:E[X(t)]=a2π0cos(ωt+θ)12πdθ=0,(对sin/cos一个周期积分,恒为零)
  • 自相关函数:RX=E[X(t)X(t+τ)]=a2E[cos(ωt+Θ)cos(ω(t+τ)+Θ)]=a22cosωτ.
  • 二阶矩:E[X2(t)]=RX(0)=a22 .
  • 时间均值:
    ¯X(t)=liml+12lllacos(ωt+Θ)dt=liml+a2l1ωsin(ωt+Θ)ll=liml+a2ωsin(ωl+Θ)sin(ωl+Θ)l=0.
    注:最后一步分子是个不超过2的数,分母趋于无穷,所以极限为零。
  • 时间相关函数:
    ¯X(t)X(t+τ)=liml+12lllacos(ωt+Θ)acos(ω(t+τ)+Θ)dt=liml+a22lllcosωτ+cos(ω(2t+τ)+2Θ)2dt=a22cosωτ.
    注,最后一步和时间均值那个积分算起来差不多,不含t的一项被提出积分号外边留下来了,含有t的一项去掉积分号以后分母带l,分子是个有限的(不超过2)的数,取极限以后变成零了。

如果是X(t)=Xcos(ωt+Θ),则数字特征(即E())里出现a2的地方换成EX2 (XΘ要相互独立),时间均值和时间相关函数里的a换成X(当心,如果振幅是随机的,则自相关函数不一定具有各态遍历性!)

随机振幅:

Z(t)=Xcos2πt+Ysin2πt

一般来说X,Y会给正态分布或者均匀分布,然后一般还会给μ=0

  • 期望:E[Z(t)]=cos2πtEX+sin2πtEY=0
  • 自相关:$E\left[ Z\left( t \right) Z\left( t+\tau \right) \right] =E\left{ \left( X\cos 2\pi t+Y\sin 2\pi t \right) \cdot \left( X\cos 2\pi \left( t+\tau \right) +Y\sin 2\pi \left( t+\tau \right) \right) \right}\ =EX^2\cos 2\pi t\cos 2\pi \left( t+\tau \right) +EY^2\sin 2\pi t\sin 2\pi \left( t+\tau \right) + \ E\left( XY \right)\cdot \left( \cos 2\pi t\sin 2\pi \left( t+\tau \right) +\sin 2\pi t\cos 2\pi \left( t+\tau \right) \right)\=EX^2\cos 2\pi t\cos 2\pi \left( t+\tau \right) +EY^2\sin 2\pi t\sin 2\pi \left( t+\tau \right) +E\left( XY \right) \cdot \sin 2\pi \left( 2t+\tau \right) .EX2=EY2X,YE(XY)=EXEY=0E\left[ Z\left( t \right) Z\left( t+\tau \right) \right] =EX^2\left( \cos 2\pi t\cos 2\pi \left( t+\tau \right) +\sin 2\pi t\sin 2\pi \left( t+\tau \right) \right) =EX^2\cos 2\pi \tau $.

三角函数和差化积与积化和差

这里因为用到了,就稍微提一下,能背下来最好,实在背不下来可以现场推导。

如果要推导的话首先要牢记和角差角公式:

cos(A±B)=cosAcosBsinAsinBsin(A±B)=sinAcosB±sinBcosA

还有变换:X=A+BY=AB

对于和差化积,以cosX+cosY为例,令X=A+BY=AB,套cos的和差角公式,
得到cos(A+B)+cos(AB)=2cosAcosB,然后由A=X+Y2,B=XY22cosX+Y2cosXY2.

对于积化和差,以cosAcosB为例,令X=A+BY=AB,还是套cos的和差角公式,
cosAcosB=12[cos(A+B)+cos(AB)].

马尔可夫链

本章讨论的随机过程{X(t),tT}的状态空间S是有限或可列集(或者说X(t0)是离散型随机变量)
X(t)=j,jS为一个状态;状态数就是看j有几个取值,题目可能给转移矩阵问状态数,就是阶数)

马尔可夫链定义(马尔可夫性):也称"无后效性",将来时刻只与现在时刻有关,与过去无关

P{X(tn+1)=jn+1X(t1)=j1,X(t2)=j2,,X(tn)=jn}=P{X(tn+1)=jn+1X(tn)=jn}

转移概率:$p_{ij}^{\left( n \right)}\left( t_m \right) =P\left{ X\left( t_{m+n} \right) =j\mid X\left( t_m \right) =i \right} (n)nt_mX(t)t_minj(n$步转移)概率。

性质:非负性 p(n)ij(tm)0,规范性:jSp(n)ij(tm)=1.

齐次马尔可夫链:一步转移概率pij不依赖于起始时刻tm.

转移矩阵P=(pij),其元素均非负,且每行和为1.

例:伯努利序列,S={0,1},转移矩阵为P=[qp qp ]

科尔莫戈罗夫-查普曼方程p(n+l)ij(tm)=kp(n)ik(tm)p(l)kj(tm+n).
对于齐次马尔可夫链,通常使用矩阵形式,P(n)=Pn,n步转移矩阵就是1步转移矩阵的n次方。

有限维概率分布:由初始时刻分布与转移概率确定。

平稳分布:(存在)满足π=πP的$\boldsymbol{\pi }=\left( \pi _0,\pi _1,\cdots ,\pi _j,\cdots \right) \pi _j\ge \text{0,}\sum_j{\pi _j}=1.\boldsymbol{\pi }^T\boldsymbol{P}\lambda=1$对应的特征向量。(可能多于一个,也可能没有)
求出特征向量后注意要归一化(所有元素之和为1)。(这部分有点类似于线性代数)

求平稳分布的一个例子(2018-2019春 解答题五),转移概率矩阵P=[023013 130230 013023 230130 ] .
解:将λ=1为特征值的特征矩阵为EP 写出,并进行初等变换:

[123013131230013123230131]r1+r3r2+r4r3,r4×3[1111111101322013]r2+r1r2r4[1111013220130000]r1r2[1021013220130000]r3+2r1r3÷5[1021013200110000]r12r3r2+3r3[1001010100110000]

x4为自由变量,可得{x1=x4x2=x4x3=x4x4=x4 ,即X=x4[1 1 1 1 ],基础解系只有一个线性无关的向量,将其"归一化"并转置得:
平稳分布为 π=(14,14,14,14).

几个齐次马尔可夫链模型(书上的例题):

  1. 伯努利独立重复试验
  2. 一维粒子随机游走
  3. 01电报机

补充

这部分内容也不知道放哪比较好,就是做往年题时记下来的一些点。

例:(18-19春 解答题三)客车载20人,一共10个车站。如果某站没人下车则客车通过该站不停车,每位乘客在各个车站下车是等可能的,且下车与否相互独立 不受别人影响。记X为停车次数,求EX
(本题并非伯努利独立重复试验,但依旧可以采用类似于伯努利的做法,先求每个子事件,再合并)
解:设Xi表示第i站是否有人下车(是则取1否则取0),则某站没人下车的概率为P{Xi=0}=(910)20E(Xi)=P{Xi=1}=1(910)20,而X=10i=1Xi,所以EX=10i=1EXi=10(1(910)20)
某一站没人下车:即每一个人(20次方)都选择其他车站(910),所以是(910)20
这道题的{Xi}并非伯努利独立重复序列,即ijXiXj不是相互独立的,
因为P{Xi=0,Xj=0}=(810)20P{Xi=0}P{Xj=0}=(81100)20,但是由于此题只让计算期望,而期望的可加性不需要相互独立,E(X+Y)=EX+EY,所以依旧可以拆分子事件算期望最后求和。

orz

posted @   Dong_HY  阅读(1000)  评论(0编辑  收藏  举报
相关博文:
阅读排行:
· Manus重磅发布:全球首款通用AI代理技术深度解析与实战指南
· 被坑几百块钱后,我竟然真的恢复了删除的微信聊天记录!
· 没有Manus邀请码?试试免邀请码的MGX或者开源的OpenManus吧
· 园子的第一款AI主题卫衣上架——"HELLO! HOW CAN I ASSIST YOU TODAY
· 【自荐】一款简洁、开源的在线白板工具 Drawnix
点击右上角即可分享
微信分享提示