概率统计A 知识总结
(搬运自 作业部落 ,不知道为啥到博客园上公式渲染全乱了)
前五章 概率论部分
概率
事件的交并差(跟集合运算差不多),条件概率 P(AB)=P(A)P(B∣A)P(AB)=P(A)P(B∣A) ,相互独立 P(AB)=P(A)P(B)P(AB)=P(A)P(B) 。
"n次抽取,放回与不放回"问题:不论放回与否,第 n 次抽中红球的概率都和第一次一样。(用全概率来推)
例:r 个红球 b 个黑球,每次抽一个,然后补充 c 个与抽中颜色相同的球,问第 n 次抽中红球的概率
(答案是 rr+brr+b ,与 n 和 c 无关,可以用归纳法,由全概率公式去递推)
看一下全概率公式,还有贝叶斯公式。(全概率比较好理解,贝叶斯最好看一下免得突然考)
随机变量
离散型随机变量,连续型随机变量。
牢记一下分布函数的概念: FX(x)=P{X≤x}FX(x)=P{X≤x} 。有时候求分布函数要从概率意义出发用定义来求。
(2020考研题,双路独立 X1,X2∼N(0,1)X1,X2∼N(0,1), MUX(X3X3,服从二点分布)选出一路, Y=X3X1+(1−X3)X2Y=X3X1+(1−X3)X2 ,求 (X1,Y)(X1,Y) 分布函数以及证明 Y∼N(0,1)Y∼N(0,1) )
分布函数的性质:单调不减,F(−∞)=0F(−∞)=0,F(+∞)=1F(+∞)=1.
分布律(分布列),概率密度函数。
二维联合分布函数:FXY(x,y)=P{X≤x,Y≤y}FXY(x,y)=P{X≤x,Y≤y} 。
联合分布(函数),边沿分布(函数);联合密度函数,边沿密度函数;条件分布函数/条件分布律/条件概率密度。
联合分布函数:FXY(x,y)FXY(x,y)或F(x,y)F(x,y);边沿分布函数:FX(x)FX(x)、FY(y)FY(y);联合密度函数fXY(x,y)fXY(x,y)或f(x,y)f(x,y);边沿密度函数:fX(x)fX(x)、fY(y)fY(y);
边沿与联合的关系:FX(x)=F(x,+∞)FX(x)=F(x,+∞), FY(y)=F(+∞,y)FY(y)=F(+∞,y);fX(x)=∫+∞−∞f(x,y)dyfX(x)=∫+∞−∞f(x,y)dy,fY(y)=∫+∞−∞f(x,y)dxfY(y)=∫+∞−∞f(x,y)dx .
条件分布律: P{Y=j∣X=i}=P{X=i,Y=j}P{X=i}P{Y=j∣X=i}=P{X=i,Y=j}P{X=i} ; P{X=i∣Y=j}=P{X=i,Y=j}P{Y=j}P{X=i∣Y=j}=P{X=i,Y=j}P{Y=j} ;
条件分布函数: FX∣Y(x∣y)FX∣Y(x∣y) ; FY∣X(y∣x)FY∣X(y∣x) ;(注意这是个极限,书P84)
条件概率密度:条件Y=yY=y下XX的 fX∣Y(x∣y)=f(x,y)fY(y)fX∣Y(x∣y)=f(x,y)fY(y),需要fY(y)≠0fY(y)≠0;反过来fY∣X(y∣x)=f(x,y)fX(x)fY∣X(y∣x)=f(x,y)fX(x) ;符号X∣YX∣Y表示:在Y=yY=y的条件下XX的条件(分布律/分布函数/概率密度)。注意"在Y=yY=y条件下"暗含P{Y=y}≠0P{Y=y}≠0或fY(y)≠0fY(y)≠0的限制。
相互独立:FX(x)FY(y)=FXY(x,y)FX(x)FY(y)=FXY(x,y),fX(x)fY(y)=fXY(x,y)fX(x)fY(y)=fXY(x,y)。(密度函数乘积只需"几乎处处相等")
多个随机变量的函数的独立:若X1,X2,X3,X4X1,X2,X3,X4相互独立,则Y1=f(X1,X2)Y1=f(X1,X2),Y2=g(X3,X4)Y2=g(X3,X4)相互独立(两个式子不共用相同的随机变量,就可以相互独立)
若X1∼N(0,1)X1∼N(0,1),X2∼N(0,1)X2∼N(0,1),且X1,X2X1,X2相互独立,则X1+X2X1+X2与X1−X2X1−X2相互独立
标准化随机变量:X∗=X−EX√DXX∗=X−EX√DX,满足EX=0,DX=1EX=0,DX=1。
正态分布
一维概率密度函数:N(μ,σ2)N(μ,σ2)
标准正态分布N(0,1)N(0,1)密度函数:φ(x)=1√2πe−x22φ(x)=1√2πe−x22,分布函数Φ(x)=1√2π∫x−∞e−t22dtΦ(x)=1√2π∫x−∞e−t22dt
(Φ(x)Φ(x)表示标准正态分布的分布函数,可以直接写)
标准正态分布分位点:下侧分位点 zα=Φ−1(α)zα=Φ−1(α) , P\left{ X\le z_{\alpha} \right} =\alphaP\left{ X\le z_{\alpha} \right} =\alpha ;上侧分位点 z1−α=−zαz1−α=−zα , P\left{ X>z_{1-\alpha} \right} =\alphaP\left{ X>z_{1-\alpha} \right} =\alpha ;双侧分位点 z1−α2z1−α2, P\left{ \left| X \right|>z_{1-\frac{\alpha}{2}} \right} =\alpha ,P\left{ \left| X \right|\le z_{1-\frac{\alpha}{2}} \right} =1-\alphaP\left{ \left| X \right|>z_{1-\frac{\alpha}{2}} \right} =\alpha ,P\left{ \left| X \right|\le z_{1-\frac{\alpha}{2}} \right} =1-\alpha 。
欧拉泊松积分: ∫+∞−∞e−x2dx=√π∫+∞−∞e−x2dx=√π
数字特征:EX=μEX=μ,DX=σ2DX=σ2,EX2=μ2+σ2EX2=μ2+σ2 。
中心2k阶矩(X∼N(μ,σ2)X∼N(μ,σ2)):E((X−μ)2k)=σ2k(2k−1)!!E((X−μ)2k)=σ2k(2k−1)!!,例如E((X−μ)6)=15σ6E((X−μ)6)=15σ6 。
正态分布的绝对值:对于Y=|X−μ|Y=|X−μ| 且 X∼N(μ,σ2)X∼N(μ,σ2),其概率密度函数f(y)={√2σ√πexp(−y22σ2)x≥00x<0f(y)={√2σ√πexp(−y22σ2)x≥00x<0 ,
(原本的密度函数只保留一边且翻倍),其数字特征可以记住:$EY=\sqrt{\frac{2}{\pi}}\sigma ,,DY=\left( 1-\frac{2}{\pi} \right) \sigma ^2$ .
中心2k+1阶绝对矩(X∼N(μ,σ2)X∼N(μ,σ2)):E|X−μ|2k+1=√2πσ2k+1⋅(2k)!!E|X−μ|2k+1=√2πσ2k+1⋅(2k)!!。
二维正态分布:(X,Y)∼N(μ1,σ21;μ2,σ22;ρ)(X,Y)∼N(μ1,σ21;μ2,σ22;ρ)。其中ρρ为相关系数。
密度函数不好背可以记其矩阵形式:(n维正态分布)
式子中,xx为随机列向量,μμ为期望列向量,CC为协方差矩阵。
(对于二维)其中 $\boldsymbol{x}=\left( x1 x2 x1 x2 \right) ,,\boldsymbol{\mu }=\left( μ1 μ2 μ1 μ2 \right) ,,\boldsymbol{C}=\left( σ21ρσ1σ2 ρσ1σ2σ22 σ21ρσ1σ2 ρσ1σ2σ22 \right) ,,\boldsymbol{C}^{-1}=\frac{1}{\left| \boldsymbol{C} \right|}\left( σ22−ρσ1σ2 −ρσ1σ2σ21 σ22−ρσ1σ2 −ρσ1σ2σ21 \right) ,,\left| \boldsymbol{C} \right|=\sigma _{1}^{2}\sigma _{2}^{2}\left( 1-\rho ^2 \right) $ 。
正态分布的性质:
- 线性性质,正态分布的线性组合仍然是正态分布,期望和方差分别按照各自的性质。
- 在正态分布中"独立"等价于"不相关",即ρ=0ρ=0。
几种常见的随机变量分布
离散型随机变量
- 两点分布(0-1分布)
- 二项分布(伯努利分布)
X∼B(n,p)X∼B(n,p) ,P{X=k}=Cknpkqn−kP{X=k}=Cknpkqn−k,EX=npEX=np,DX=npqDX=npq。其中q=1−pq=1−p,k=0,1,⋯,nk=0,1,⋯,n。
要会计算E(etX)E(etX)(etketk和pkpk合并,二项式定理),参考结果:(pet+q)n(pet+q)n (18-19,16-17往年题里均有)
求和性质:B(n1,p)+B(n2,p)∼B(n1+n2,p)B(n1,p)+B(n2,p)∼B(n1+n2,p)。
- 泊松分布
X∼Π(λ)X∼Π(λ),P{X=k}=e−λλkk!P{X=k}=e−λλkk!,EX=DX=λEX=DX=λ。其中k=0,1,⋯k=0,1,⋯。
与二项分布关系:当n很大p很小时,λ=npλ=np用于逼近二项分布。
求和性质:Π(λ1)+Π(λ2)∼Π(λ1+λ2)Π(λ1)+Π(λ2)∼Π(λ1+λ2)。
- 超几何分布
正品MM件,次品NN件,从中取nn件,正品数量kk件:P{X=k}=CkNCn−kMCnM+NP{X=k}=CkNCn−kMCnM+N。其中k=0,1,⋯,min{M,n}k=0,1,⋯,min{M,n} .
(公式不要记,用古典概型-事件空间角度理解,自己推)
注意看清N是总数还是次品!(黑球白球问题同理)
数学期望:NN为次品数则EX=nMM+NEX=nMM+N,NN为总数则EX=nMNEX=nMN。
连续型随机变量
- 正态分布
- 均匀分布
- 指数分布
概率密度函数:f(x)={λe−λxx≥00x<0f(x)={λe−λxx≥00x<0,分布函数F(x)={0x<01−e−λxx≥0F(x)={0x<01−e−λxx≥0 。
数字特征:EX=1λEX=1λ,DX=1λ2DX=1λ2 。
随机变量函数的分布
离散型没什么好说的,列出分布列然后合并同类项就可以。
连续型主要是找对积分区间,对自变量的概率密度求积分,得到因变量的分布函数。先有分布函数再求导就可以得到概率密度函数。
即:FY(y)=∫Y≤yf(x)dxFY(y)=∫Y≤yf(x)dx,FZ(z)=∬Z≤zf(x,y)dxdyFZ(z)=∬Z≤zf(x,y)dxdy。
P105定理:一维随机变量XX,密度函数f(x)f(x),Y=g(X)Y=g(X),gg为单调函数,则
其中hh为gg的反函数,有X=h(Y)X=h(Y)。
应用上述定理时gg必须是单调函数。如果是分段单调也可分割区间分别处理。
绝对值Y=|X|Y=|X|,对于正态分布,其概率密度函数变两倍,只取右边。
几个二维随机变量函数的分布(P111-114)
- Z=X+YZ=X+Y (主要还是理解过程,记公式意义不大)
P{Z≤z}=P{X+Y≤z}P{Z≤z}=P{X+Y≤z},积分区域为直线y=z−xy=z−x以下的区域。如果是无穷区域,用y=z−xy=z−x换元后Fubini换序积分,得fZ(z)=∫+∞−∞f(x,z−x)dxfZ(z)=∫+∞−∞f(x,z−x)dx ,此积分可转化为曲线积分fZ(z)=∫¯ABf(x,y)dxfZ(z)=∫¯¯¯¯¯¯¯¯ABf(x,y)dx 计算,其中直线¯AB:x+y=z¯¯¯¯¯¯¯¯AB:x+y=z 沿xx增加的方向。同理fZ(z)=∫+∞−∞f(z−y,y)dy=∫¯BAf(x,y)dyfZ(z)=∫+∞−∞f(z−y,y)dy=∫¯¯¯¯¯¯¯¯BAf(x,y)dy
对于有限区域直接(分段)算二重积分或者曲线积分就行,不用背公式。
- Z=max{X,Y}Z=max{X,Y}
P{Z≤z}=P{X≤z,Y≤z}P{Z≤z}=P{X≤z,Y≤z} ,
分布函数Fmax(z)=FXY(z,z)Fmax(z)=FXY(z,z),对于n个独立同分布变量,Fmax(z)=[F(z)]nFmax(z)=[F(z)]n。
- Z=min{X,Y}Z=min{X,Y}
P{Z≤z}=P{X≤z∪Y≤z}P{Z≤z}=P{X≤z∪Y≤z},
分布函数Fmin(z)=FX(z)+FY(z)−FXY(z,z)Fmin(z)=FX(z)+FY(z)−FXY(z,z),对于n个独立同分布变量,Fmin(z)=1−[1−F(z)]nFmin(z)=1−[1−F(z)]n 。
随机变量的数字特征
- 期望和方差:单个随机变量
- 协方差和相关系数,协方差矩阵:两个或多个随机变量的关系
随机变量的期望:连续型E(X)=∫+∞−∞xfX(x)dxE(X)=∫+∞−∞xfX(x)dx,离散型E(X)=∑kk⋅P{X=k}E(X)=∑kk⋅P{X=k} .
随机变量函数的期望:连续型 E[g(X)]=∫+∞−∞g(x)fX(x)dxE[g(X)]=∫+∞−∞g(x)fX(x)dx,离散型 E\left[g(X)\right]=\sum_k g(k)P \left{ X=k \right}E\left[g(X)\right]=\sum_k g(k)P \left{ X=k \right}
(直接在期望公式中把X替换即可,概率/概率密度项不动。)
离散型随机变量函数的期望,计算时可能涉及级数(几何级数,泰勒级数,逐项积分/求导),二项式定理。
例:已知几何分布$P\left{X=k\right}=pq^{k-1}, k=1,2,\cdots; q=1-p ,求,求E(e^{\text{i}tX})$。(几何级数)
解:E(eitX)=∑∞k=1eitk⋅p⋅qk−1=eit⋅p⋅∑∞k=1eit(k−1)qk−1=peit⋅∑∞k=0(qeit)k=peit11−qeitE(eitX)=∑∞k=1eitk⋅p⋅qk−1=eit⋅p⋅∑∞k=1eit(k−1)qk−1=peit⋅∑∞k=0(qeit)k=peit11−qeit .
其中最后一步依据为几何级数11−x=∑∞k=0xk11−x=∑∞k=0xk,收敛半径为1,而|qeit|=q<1∣∣qeit∣∣=q<1 在收敛域内。例:已知二项分布X∼B(n,p)X∼B(n,p),求E(etX)E(etX)。(二项式定理)
解:E(etX)=∑nk=0Cknpkq1−k⋅etk=∑nk=0Ckn(pet)kq1−k=(pet+q)nE(etX)=∑nk=0Cknpkq1−k⋅etk=∑nk=0Ckn(pet)kq1−k=(pet+q)n 。
例:已知泊松分布X∼Π(λ)X∼Π(λ),证明期望EX=λEX=λ,且判断$E\left( \frac{1}{X+1} \right) 与与\frac{1}{\lambda +1}的关系(的关系(e^x$的泰勒级数)
解:EX=e−λ∑∞k=0λkk!⋅k=e−λ∑∞k=1λk(k−1)!=λ⋅e−λ∑∞k=1λk−1(k−1)!=λe−λ∑∞k=0λkk!EX=e−λ∑∞k=0λkk!⋅k=e−λ∑∞k=1λk(k−1)!=λ⋅e−λ∑∞k=1λk−1(k−1)!=λe−λ∑∞k=0λkk!
$=\lambda e^{-\lambda}\cdot e^{\lambda}=\lambda ,其中最后一步由指数函数,其中最后一步由指数函数ex的泰勒级数的泰勒级数ex=\sum_{n=0}{\infty}{\frac{xn}{n!}}得到。而得到。而E\left( \frac{1}{X+1} \right) =e{-\lambda}\sum_{k=0}\cdot \frac{1}{k+1}}=e{-\lambda}\sum_{k=0}{\left( k+1 \right) !}}=\frac{e{-\lambda}}{\lambda}\sum_{k=1}{\frac{\lambda k}{k!}}=\frac{e{-\lambda}}{\lambda}\cdot \left( e^{\lambda}-1 \right)=\frac{1}{\lambda}-\frac{e^{-\lambda}}{\lambda}$ ,
下面比较1λ−e−λλ1λ−e−λλ和1λ+11λ+1的大小关系:1λ−1λ+1=1λ(λ+1)1λ−1λ+1=1λ(λ+1),e−λλ=1λeλe−λλ=1λeλ,由于λ>0λ>0,eλ>λ+1eλ>λ+1 ,所以1λ(λ+1)>1λeλ1λ(λ+1)>1λeλ,∴1λ−1λ+1>e−λλ∴1λ−1λ+1>e−λλ,∴1λ−e−λλ>1λ+1∴1λ−e−λλ>1λ+1,即E(1X+1)>1λ+1E(1X+1)>1λ+1 。(18-19上)
方差的计算公式:DX=E(X−EX)2=EX2−(EX)2DX=E(X−EX)2=EX2−(EX)2
期望的线性性质:
数乘 E(aX)=aEXE(aX)=aEX,
相加 E(X+Y)=EX+EYE(X+Y)=EX+EY(不需要相互独立),
线性组合 E(aX+bY+c)=aEX+bEY+cE(aX+bY+c)=aEX+bEY+c(不用独立)
乘积的期望: E(XY)=EX⋅EYE(XY)=EX⋅EY(要求相互独立)
方差性质:(并不保线性)
系数平方 D(aX)=a2DXD(aX)=a2DX,
平移不变 D(X+C)=DXD(X+C)=DX,
相加 D(X±Y)=DX+DYD(X±Y)=DX+DY(此时要求X,YX,Y相互独立)
线性组合 D(aX+bY+c)=a2DX+b2DYD(aX+bY+c)=a2DX+b2DY (相互独立)
矩的概念
原点矩,中心矩;k阶矩;绝对矩;混合矩;
协方差
协方差定义:Cov(X,Y)=E[(X−EX)⋅(Y−EY)]Cov(X,Y)=E[(X−EX)⋅(Y−EY)]
计算公式:
用期望:Cov(X,Y)=E(XY)−EX⋅EYCov(X,Y)=E(XY)−EX⋅EY,
用方差:D(X±Y)=DX+DY±2Cov(X,Y)D(X±Y)=DX+DY±2Cov(X,Y),(别忘了公式里有个2倍)
性质:
对称 Cov(X,Y)=Cov(Y,X)Cov(X,Y)=Cov(Y,X),
倍乘 Cov(aX,bY)=abCov(X,Y)Cov(aX,bY)=abCov(X,Y),
相加 Cov(X1+X2,Y)=Cov(X1,Y)+Cov(X2,Y)Cov(X1+X2,Y)=Cov(X1,Y)+Cov(X2,Y) ,
方差 Cov(X,X)=DXCov(X,X)=DX
相关系数
定义:ρ=Cov(X,Y)√DX⋅√DYρ=Cov(X,Y)√DX⋅√DY 。
表示两随机变量的线性相关程度,|ρ|≤1|ρ|≤1恒成立。ρρ是无量纲数。
ρ=1ρ=1:正线性;ρ=−1ρ=−1:负线性;ρ>0ρ>0:正相关;ρ<0ρ<0:负相关;ρ=0ρ=0:不相关。
注意:不相关不一定相互独立。反例:非矩形形状的均匀分布,不满足fXY(x,y)=fX(x)fY(y)fXY(x,y)=fX(x)fY(y)。
对于正态分布:ρ=0ρ=0 不相关即为相互独立。
代入标准化随机变量有:$\rho_{XY} =\text{Cov}\left( X{\ast},Y \right) $ 。
协方差矩阵
二维随机向量:$\boldsymbol{C}=\left( \begin{matrix}
\sigma _{1}^{2}& \rho \sigma _1\sigma _2\
\rho \sigma _1\sigma _2& \sigma {2}^{2}\
\end{matrix} \right) ,n维:,n维:c=\text{Cov}\left( X_i,X_j \right) $。
几个不等式
- |E(XY)|≤(EX2)12⋅(EY2)12|E(XY)|≤(EX2)12⋅(EY2)12 ,(柯西-施瓦茨)
- (E|X+Y|2)12≤(EX2)12+(EY2)12(E|X+Y|2)12≤(EX2)12+(EY2)12 ,
- |Cov(X,Y)|≤√DX⋅√DY|Cov(X,Y)|≤√DX⋅√DY ,
- |P(AB)−P(A)P(B)|≤{P(A)[1−P(A)]}12{P(B)[1−P(B)]}12|P(AB)−P(A)P(B)|≤{P(A)[1−P(A)]}12{P(B)[1−P(B)]}12 ,
六七八九章 数理统计部分
第六章
切比雪夫不等式
导出形式:P{|X−EX|<ε}≥1−DXε2P{|X−EX|<ε}≥1−DXε2 。
意义:用二阶偏差"控制"一阶偏差。
大数定律
切比雪夫大数定律
一列相互独立的随机序列$X_1,X_2,\cdots ,X_n,\cdots ,令,令Y_n=\frac{1}{n}\sum_{i=1}^n{X_i}=\bar{X}_n。由方差一致有界(。由方差一致有界(D\left( X_i \right) \le C)得:)得:\underset{n\to\infty}{\lim} DY_n=0,或,或\forall \varepsilon >\text{0, }\underset{n\rightarrow \infty}{\lim}P\left{ \left| Y_n-EY_n \right|<\varepsilon \right} =1$ 。
注:方差一致有界的条件可以放松,只要CC是nn的低阶无穷大即可(limn→∞Cn=0limn→∞Cn=0)。
依概率收敛:∀ε>0, limn→∞P{|Xn−X|<ε}=1∀ε>0, limn→∞P{|Xn−X|<ε}=1,记为XnP→XXnP→X。
辛钦大数定律
{Xn}{Xn}独立同分布,EXi=μEXi=μ,DXi=σ2DXi=σ2,则limn→∞P{|ˉX−μ|<ε}=1limn→∞P{∣∣¯X−μ∣∣<ε}=1 (ˉXP→μ¯XP→μ)
伯努利大数定律
伯努利n次独立重复试验,nAnA表示事件A发生的次数,p为A发生的概率,则limn→∞P{|nAn−p|<ε}=1limn→∞P{∣∣nAn−p∣∣<ε}=1。
中心极限定理
随机序列{Xn}{Xn}独立同分布,EXi=μEXi=μ,DXi=σ2≠0DXi=σ2≠0。
令Yn=∑ni=1XiYn=∑ni=1Xi,当n充分大时,近似地有:$Y_{n}^{\ast}\sim N\left( \text{0,}1 \right) ,,Y_n\sim N\left( n\mu ,n\sigma ^2 \right) $ 。
棣莫弗-拉普拉斯定理
伯努利n次独立重复试验,μnμn表示事件A发生次数,p是事件A发生的概率,则∀[a,b]∀[a,b],
理解:由二项分布,Eμn=npEμn=np,Dμn=np(1−p)Dμn=np(1−p);由中心极限定理,μ∗n∼N(0,1)μ∗n∼N(0,1),即得上式。
一个便于记忆的形式:
(其中M和N均为整数,代表一个"事件发生次数";μ∗n=μn−np√np(1−p)μ∗n=μn−np√np(1−p),N∗=N−np√np(1−p)N∗=N−np√np(1−p))
上面这个约等式也可以是单边概率,即N→−∞N→−∞或M→+∞M→+∞。
本部分题型主要参考课后题,一般就是用定理去估计一件事的概率,或者是给定概率求N之类的。
第七章 统计总体与样本
样本统计量
样本均值:ˉX=1n∑ni=1Xi¯X=1n∑ni=1Xi,
样本方差:S2=1n−1∑ni=1(Xi−ˉX)2S2=1n−1∑ni=1(Xi−¯X)2,(注意分母是n−1n−1)!!!
(k阶原点、中心矩:Ak=1n∑ni=1XkiAk=1n∑ni=1Xki,Bk=1n∑ni=1(Xi−ˉX)kBk=1n∑ni=1(Xi−¯X)k)注意B2≠S2B2≠S2。
样本统计量的数字特征:EˉX=μE¯X=μ,DˉX=σ2nD¯X=σ2n;ES2=σ2ES2=σ2。(任何分布的总体都可以)
样本统计量的分布(正态,卡方,t,F)
此处只针对正态总体。
四种分布
- 正态分布,标准正态分布N(0,1)N(0,1)及其分位点(下侧:zαzα,双侧:z1−α2z1−α2)
- 卡方分布χ2(n)χ2(n)及其期望、方差、分位点χ2α(n)χ2α(n)
n路标准正态分布(Xi∼N(0,1)Xi∼N(0,1))之和服从自由度为n的卡方分布,∑ni=1X2i∼χ2(n)∑ni=1X2i∼χ2(n)。
若X∼χ2(n)X∼χ2(n),则EX=nEX=n,DX=2nDX=2n。χ2(n1)+χ2(n2)∼χ2(n1+n2)χ2(n1)+χ2(n2)∼χ2(n1+n2)。
标准正态的平方是卡方分布:X∼N(0,1)X∼N(0,1)则X2∼χ2(1)X2∼χ2(1)。
- t分布t(n)t(n)及其分位点(下侧:tα(n)tα(n),双侧:t1−α2t1−α2)
形式:N(0,1)√χ2(n)/n∼t(n)N(0,1)√χ2(n)/n∼t(n),期望和方差不用知道。
- F分布
形式:$\frac{\chi ^2\left( n_1 \right) /n_1}{\chi ^2\left( n_2 \right) /n_2}\sim F\left( n_1,n_2 \right) ,t分布的平方是F分布(,t分布的平方是F分布(T\sim t(n),,T^2\sim F(1,n)$)
统计量的分布
正态:$\bar{X}\sim N\left( \mu ,\frac{\sigma ^2}{n} \right) ,,X_j-\bar{X}\sim N(0, \frac{n-1}{n}\sigma^2),标准正态:,标准正态:\bar{X}^{\ast}=\frac{\bar{X}-\mu}{\sigma \sqrt{n}}\sim N\left( \text{0,}1 \right) ,,X_{i}^{\ast}=\frac{X_i-\mu}{\sigma}\sim N\left( \text{0,}1 \right) $,
卡方:n−1σ2S2∼χ2(n−1)n−1σ2S2∼χ2(n−1),DS2=2σ4n−1DS2=2σ4n−1。
一对自由度差异:∑ni=1(Xi−ˉXσ)2∼χ2(n−1)∑ni=1(Xi−¯Xσ)2∼χ2(n−1),∑ni=1(Xi−μσ)2∼χ2(n)∑ni=1(Xi−μσ)2∼χ2(n)。(用正态线性函数的结论)
t分布:ˉX−μS/√n∼t(n−1)¯X−μS/√n∼t(n−1) ,
$\frac{\left( \bar{X}-\bar{Y} \right) -\left( \mu 1-\mu 2 \right)}{\sqrt{\left( m-1 \right) S^{2}+\left( n-1 \right) S^{2}}}\cdot \sqrt{\frac{mn\left( m+n-2 \right)}{m+n}}\sim t\left( m+n-2 \right) ,,\frac{\bar{X}-\bar{Y}-\left( \mu _1-\mu 2 \right)}{S_1\sqrt{\text{1/}n+\text{1/}m}}\sim t\left( m-1 \right) ,,\sqrt{\frac{n}{n+1}}\frac{X-\bar{X}}{S}\sim t\left( n-1 \right) $
F分布:n(ˉX−μ)2S2∼F(1,n−1)n(¯X−μ)2S2∼F(1,n−1)
对于正态总体 N(μ,σ2)N(μ,σ2) ,设其样本均值为 ˉX¯X ,样本方差为 S2S2 ,则有 ˉX¯X 与 S2S2 相互独立。
参数的点估计
矩估计
一个参数:直接用EX。注意:^θ2^θ2如果能直接估计出来,不要先估计ˆθ^θ再平方,会有累积误差。
两个参数:$\left{ EX=ˉX DX=S2 EX=¯X DX=S2 \right. ,,\left{ EX=ˉX DX=B2 EX=¯X DX=B2 \right. ,或,或\left{ EX=ˉX EX2=A2 EX=¯X EX2=A2 \right. $都可以(第一种最好,第二种不是无偏估计)
极大似然估计
构造似然函数L(θ)L(θ),找到使得L(θ)L(θ)取最大值的ˆθ^θ。一般情况下令L′(θ)=0L′(θ)=0,也有特殊情况无法求导处理。
似然函数的构造:离散型 L(θ)=∏ni=1P{Xi=xi}L(θ)=∏ni=1P{Xi=xi},连续型 L(θ)=∏ni=1f(xi)L(θ)=∏ni=1f(xi)。
(把所有样本的概率/概率密度全乘起来)
可以求导的典型例子:指数分布;不能求导的典型例子:均匀分布
常考的可以求导的形式:P⋅eQP⋅eQ,其中P,Q均为含xx与θθ的仅乘除的式子(单项式或者分式),例如指数分布。
不能用求导的例子P203:f(x)={1θ0≤x≤θ0Othersf(x)={1θ0≤x≤θ0Others ,\hat{\theta}=\max \left{ x_1,\cdots ,x_n \right}\hat{\theta}=\max \left{ x_1,\cdots ,x_n \right} 。
点估计的优良性
- 无偏估计:E(ˆθ)=θE(^θ)=θ。
- 最小方差无偏估计:D(ˆθ)D(^θ)最小
- 一致估计(相合估计):ˆθP→θ^θP→θ。(用大数定律)
一些结论:(设总体期望为μμ,总体方差为σσ)
- ˉX¯X是μμ的无偏估计,也是最小方差线性无偏估计
- S2S2是σ2σ2的无偏估计,而B2B2不是无偏的。
- 用样本的线性组合对总体无偏估计,系数越平均,方差越小
- 正态总体的ˉX¯X是μμ的一致估计,S2S2是σ2σ2的一致估计
- 正态总体的方差:^σ2=1n−1∑ni=1(Xi−ˉX)2^σ2=1n−1∑ni=1(Xi−¯X)2(矩估计)和^σ2=1n∑ni=1(Xi−μ0)2^σ2=1n∑ni=1(Xi−μ0)2(极大似然)都是^σ2^σ2的无偏估计,后者更优。
区间估计与假设检验
我把这两块写到一起了,因为他们的本质和用到的方法都是一样的。
区间估计里的"置信概率":1−α1−α;假设检验里的"检验水平(显著性水平)":αα;这两者里的αα是等价的。
假设检验要按步骤写,写原假设和备择假设;选取检验用的统计量;确定检验水平和拒绝域;代入样本值检验。
假设检验的两类错误:错误拒绝H0(第一类),错误接受H0(第二类)。第一类错误的概率要会算(和αα有关)
大体上分为三类:知(总体)方差检验期望,未知方差检验期望,检验方差。(选取的统计量和分布不同)
每种检验/估计分为双边、左边、右边。(选取双侧分位点或下侧/上侧分位点)
- 已知σ2σ2检验μ0μ0:
选取的统计量:U=ˉX−μ0σ/√nU=¯X−μ0σ/√n,服从的分布:N(0,1)N(0,1)。
双侧假设检验:$P\left{ \left| U \right|>z_{1-\frac{\alpha}{2}} \right} =\alpha ,双侧,双侧\mu置信区间:置信区间:\left[ \bar{x}-z_{1-\frac{\alpha}{2}}\frac{\sigma}{\sqrt{n}},\bar{x}+z_{1-\frac{\alpha}{2}}\frac{\sigma}{\sqrt{n}} \right]$。
左边检验(H1:μ<μ0H1:μ<μ0):$P\left{ U<-z_{1-\alpha} \right} =\alpha ;置信区间:;置信区间:\left( -\infty ,\bar{x}+z_{1-\alpha}\frac{\sigma}{\sqrt{n}} \right] .右边检验(.右边检验(H_1:\mu>\mu_0):P\left{ U>z_{1-\alpha} \right} =\alpha;置信区间:\left[ \bar{x}-z_{1-\alpha}\frac{\sigma}{\sqrt{n}},+\infty \right) $.
- 未知σ2检验μ0:
选取的统计量:T=ˉX−μ0s/√n,服从的分布:t(n−1)。(注意自由度,是n-1)
双侧假设检验:$P\left{ \left| T \right|>t_{1-\frac{\alpha}{2}} \right} =\alpha ,双侧\mu置信区间:\left[ \bar{x}-t_{1-\frac{\alpha}{2}}\frac{s}{\sqrt{n}},\bar{x}+t_{1-\frac{\alpha}{2}}\frac{s}{\sqrt{n}} \right]$。
- 检验σ2:
选取的统计量:W=(n−1)s2σ2,服从的分布:χ2(n−1)。(注意自由度,是n-1)
双侧假设检验:$P\left{ W>\chi _{1-\frac{\alpha}{2}}^{2}\cup W<\chi _{\frac{\alpha}{2}}^{2} \right} =\alpha ,双侧\sigma^2 置信区间:\left[ \frac{\left( n-1 \right) s^2}{\chi _{1-\frac{\alpha}{2}}^{2}\left( n-1 \right)},\frac{\left( n-1 \right) s^2}{\chi _{\frac{\alpha}{2}}^{2}\left( n-1 \right)} \right],双侧\sigma置信区间:\left[ \sqrt{\frac{\left( n-1 \right) s^2}{\chi _{1-\frac{\alpha}{2}}^{2}\left( n-1 \right)}},\sqrt{\frac{\left( n-1 \right) s^2}{\chi _{\frac{\alpha}{2}}^{2}\left( n-1 \right)}} \right]$。
卡方这里分位点选取并不唯一,也可以选χ21−23α,χ2α3,只要保证两个α的系数(的绝对值)加起来等于一就可以。(或者两个系数相减等于1−α,本质一样)
此部分考试的注意要点
根据往年题经验,一般是考一个选择题,让判断一个随机变量(统计量)在某区间里的概率对不对。判断起来并不难,主要就是看选取的统计量和采用的分位点分布种类是否匹配。比如说如果统计量T搭配了正态分布分位点z1−α2肯定是不对的。然后就是双侧分位点选取的灵活处理。题目有可能不是用的两边对称的1−α2双侧分位点,这时候可以简单画图验证一下。
(正态分布和t分布都是单峰对称的,(−∞,+∞),而卡方分布是单峰不对称的,(0,+∞)。)
先排除统计量与分布对应不上的,再看分位点选取是否正确。
最后三章 随机过程部分
随机过程
随机过程X(t),相当于"一族"随机变量,与样本和时间有关(X(e,t))。
样本(函数):固定e保留时间t变化,即x(t)=X(e0,t);是个关于t的函数
状态(变量):固定t保留样本e变化,即X(t1)=X(e,t1);是个随机变量
状态空间:{X(e,t)∣e∈S,t∈T},即X的值域。样本空间S={e};参数集T:参数t取值范围。
随机序列:参数t离散的情况,即{Xn}。
n维分布函数;两个随机过程的有限维联合分布函数;要会写一维F1(x1;t1)和二维F2(x1,x2;t1,t2) 。
独立过程(任何n个状态都独立)
数字特征
单个过程
(对于二阶矩存在的过程,只要知道μ和RX就可以确定其他三个)
-
期望:μX(t)=E[X(t)];
-
二阶矩:Ψ2X(t)=E[X2(t)];Ψ2X(t)=RX(t,t);
-
方差:σ2X(t)=D[X(t)]=Ψ2X(t)−μ2X(t);σ2X(t)=CX(t,t);
-
自相关函数:RX(t1,t2)=E[X(t1)⋅X(t2)];
-
自协方差:CX(t1,t2)=Cov(X(t1),X(t2))=RX(t1,t2)−μX(t1)⋅μX(t2);
两个过程
- 互相关函数:RXY(t1,t2)=E[X(t1)⋅Y(t2)]
- 互协方差:CXY(t1,t2)=Cov(X(t1),Y(t2))=RXY(t1,t2)−μX(t1)⋅μY(t2);
两过程相互独立:RXY(t1,t2)=μX(t1)⋅μY(t2);
任意时刻CXY(t1,t2)=0则X(t)与Y(t)不相关。
平稳过程
严平稳
条件:
(1)一维分布函数F(x1;t)=F(x1)不依赖于参数t;
(2)二维分布函数F(x1,x2;t1,t2)=F(x1,x2;τ)仅依赖于参数间距τ=t2−t1;
性质:
(1)μX,Ψ2X,σ2X与时间t无关;
(2)RX(τ),CX(τ)只与间距τ=t2−t1有关,与t1的原点选取无关。
(RX(τ)=E[X(t)X(t+τ)])
严平稳过程举例:伯努利序列。
广义平稳
条件:
(1)原点二阶矩E[X2(t)]存在
(2)期望E[X(t)]=μX为常数
(3)自相关函数E[X(t)X(t+τ)]=RX(τ)只与τ有关,与t无关
性质:前三个数字特征都是常数;后两个数字特征只与间距有关。
注 σ2X=CX(0),Ψ2X=RX(0); RX(τ)与CX(τ)均为偶函数.
平稳(时间)序列:参数t为整数或者可列;
两个平稳的关系:
严平稳+二阶矩存在=广义平稳;广义平稳不一定严平稳;严平稳不一定广义平稳(二阶矩不一定存在)
两个平稳过程之间的关系:
(1)联合平稳过程:E[X(t)Y(t+τ)]=RXY(τ);此时CXY(τ)=RXY(τ)−μXμY。
(2)标准互协方差:ρXY(τ)=CXY(τ)√CX(0)⋅CY(0),等于零时则两个平稳过程不相关。
注:检验(广义)平稳过程,一定要说明二阶矩E[Y2(t)]存在且有限(直接代RX(0)说明即可,但不能不写)!
正态(平稳)过程
正态过程:∀t都有X(t)服从正态分布;
正态序列;独立正态过程;
正态平稳过程:正态过程X(t)为(广义)平稳过程。
记个结论:正态过程X(t)其中t∈(−∞,+∞),满足E[X(t)]=μX=0,则:
- 一维分布:X(t)∼N(0,RX(0));
- 二维分布:(X(t1),X(t2))∼N(0,RX(0);0,RX(0);RX(τ)RX(0)).
遍历过程
时间均值和时间相关函数的概念
- 时间均值:¯X(t)=¯X(e,t)=liml→+∞12l∫l−lX(e,t)dt,其中¯X(t)是个随机变量。
- 时间相关函数:¯X(t)X(t+τ)=liml→+∞12l∫l−lX(e,t)X(e,t+τ)dt,是一个关于τ的随机过程。
对于单边的情况(t>0,$\left{ X\left( t \right) ,t\in \left[ \text{0,}+\infty \right) \right} ),将\frac{1}{2l}\int_{-l}l换成\frac{1}{l}\int_{0}l$即可。
平稳过程的各态遍历性
- 均值的各态遍历性:P{¯X(t)=μX}=1;
- 自相关函数的各态遍历性:P{¯X(t)X(t+τ)=RX(τ)}=1;
满足两个各态遍历性:遍历过程。
确定遍历过程的数字特征:只需获得一个样本函数即可。
- ˆμX=1l∫l0x(t)dt;ˆRX(τ)=1l−τ∫l−τ0x(t)x(t+τ)dt;
书上的例子:
- 随机相位正弦波X(t)=asin(ωt+Θ),Θ∼U[0,2π].
- 随机相位周期过程X(t)=S(t+Θ),周期为T,Θ∼U[0,T].
例4:平稳过程X(t)的RX(τ)以T为周期,则∀t,P{X(t+T)=X(T)}=1。
不是遍历过程的平稳过程:X(t)=Y,Y是个随机变量。
各态遍历性判别定理
给一个随机过程{X(t),t∈T},
- 二阶矩过程:E[X2(t)]存在且有限.
- 均方连续:∀t0∈T,limt→t0E|X(t)−X(t0)|2=0.
均方连续平稳过程的¯X(t)的期望和方差:
E[¯X(t)]=E[X(t)]=μX,D[¯X(t)]=liml→+∞1l∫2l0(1−τ2l)[RX(τ)−μ2X]dτ. - 均值各态遍历定理:均方连续平稳过程,时间均值各态遍历性的充要条件:
对于−∞<t<+∞:D[¯X(t)]=liml→+∞1l∫2l0(1−τ2l)[RX(τ)−μ2X]dτ=0.
对于0<t<+∞:liml→+∞1l∫l0(1−τl)[RX(τ)−μ2X]dτ=0.
随机正弦波的性质
随机正弦波基本形式:X(t)=Xcos(ωt+Θ),其中X,Θ都是随机变量(随机振幅,随机相位)或者常数。
(这里写成sin和cos都等价,书上都写的余弦,这里就写余弦了)
随机相位:
其中Θ为随机变量,一般题目会给均匀分布Θ∼U[0,2π]或U[−π,π],也可能是其他的。
- 期望:E[X(t)]=a∫2π0cos(ωt+θ)12πdθ=0,(对sin/cos一个周期积分,恒为零)
- 自相关函数:RX=E[X(t)X(t+τ)]=a2E[cos(ωt+Θ)⋅cos(ω(t+τ)+Θ)]=a22cosωτ.
- 二阶矩:E[X2(t)]=RX(0)=a22 .
- 时间均值:
¯X(t)=liml→+∞12l∫l−lacos(ωt+Θ)dt=liml→+∞a2l⋅1ωsin(ωt+Θ)∣l−l=liml→+∞a2ωsin(ωl+Θ)−sin(−ωl+Θ)l=0.
注:最后一步分子是个不超过2的数,分母趋于无穷,所以极限为零。 - 时间相关函数:
¯X(t)X(t+τ)=liml→+∞12l∫l−lacos(ωt+Θ)⋅acos(ω(t+τ)+Θ)dt=liml→+∞a22l∫l−lcosωτ+cos(ω(2t+τ)+2Θ)2dt=a22cosωτ.
注,最后一步和时间均值那个积分算起来差不多,不含t的一项被提出积分号外边留下来了,含有t的一项去掉积分号以后分母带l,分子是个有限的(不超过2)的数,取极限以后变成零了。
如果是X(t)=Xcos(ωt+Θ),则数字特征(即E(⋯))里出现a2的地方换成EX2 (X和Θ要相互独立),时间均值和时间相关函数里的a换成X(当心,如果振幅是随机的,则自相关函数不一定具有各态遍历性!)
随机振幅:
一般来说X,Y会给正态分布或者均匀分布,然后一般还会给μ=0。
- 期望:E[Z(t)]=cos2πt⋅EX+sin2πt⋅EY=0,
- 自相关:$E\left[ Z\left( t \right) Z\left( t+\tau \right) \right] =E\left{ \left( X\cos 2\pi t+Y\sin 2\pi t \right) \cdot \left( X\cos 2\pi \left( t+\tau \right) +Y\sin 2\pi \left( t+\tau \right) \right) \right}\ =EX^2\cos 2\pi t\cos 2\pi \left( t+\tau \right) +EY^2\sin 2\pi t\sin 2\pi \left( t+\tau \right) + \ E\left( XY \right)\cdot \left( \cos 2\pi t\sin 2\pi \left( t+\tau \right) +\sin 2\pi t\cos 2\pi \left( t+\tau \right) \right)\=EX^2\cos 2\pi t\cos 2\pi \left( t+\tau \right) +EY^2\sin 2\pi t\sin 2\pi \left( t+\tau \right) +E\left( XY \right) \cdot \sin 2\pi \left( 2t+\tau \right) .如果题目中有EX2=EY2,且X,Y相互独立,E(XY)=EXEY=0,则E\left[ Z\left( t \right) Z\left( t+\tau \right) \right] =EX^2\left( \cos 2\pi t\cos 2\pi \left( t+\tau \right) +\sin 2\pi t\sin 2\pi \left( t+\tau \right) \right) =EX^2\cos 2\pi \tau $.
三角函数和差化积与积化和差
这里因为用到了,就稍微提一下,能背下来最好,实在背不下来可以现场推导。
如果要推导的话首先要牢记和角差角公式:
还有变换:X=A+B,Y=A−B。
对于和差化积,以cosX+cosY为例,令X=A+B,Y=A−B,套cos的和差角公式,
得到cos(A+B)+cos(A−B)=2cosAcosB,然后由A=X+Y2,B=X−Y2得2cosX+Y2cosX−Y2.对于积化和差,以cosAcosB为例,令X=A+B,Y=A−B,还是套cos的和差角公式,
得cosAcosB=12[cos(A+B)+cos(A−B)].
马尔可夫链
本章讨论的随机过程{X(t),t∈T}的状态空间S是有限或可列集(或者说X(t0)是离散型随机变量)
(X(t)=j,j∈S为一个状态;状态数就是看j有几个取值,题目可能给转移矩阵问状态数,就是阶数)
马尔可夫链定义(马尔可夫性):也称"无后效性",将来时刻只与现在时刻有关,与过去无关
转移概率:$p_{ij}^{\left( n \right)}\left( t_m \right) =P\left{ X\left( t_{m+n} \right) =j\mid X\left( t_m \right) =i \right} ,角标(n)表示n步转移,t_m表示起始时刻。书上写的含义:X(t)在时刻t_m时由状态i经过n步转移到达状态j的(n$步转移)概率。
性质:非负性 p(n)ij(tm)≥0,规范性:∑j∈Sp(n)ij(tm)=1.
齐次马尔可夫链:一步转移概率pij不依赖于起始时刻tm.
转移矩阵:P=(pij),其元素均非负,且每行和为1.
例:伯努利序列,S={0,1},转移矩阵为P=[qp qp ] 。
科尔莫戈罗夫-查普曼方程:p(n+l)ij(tm)=∑kp(n)ik(tm)p(l)kj(tm+n).
对于齐次马尔可夫链,通常使用矩阵形式,P(n)=Pn,n步转移矩阵就是1步转移矩阵的n次方。
有限维概率分布:由初始时刻分布与转移概率确定。
平稳分布:(存在)满足π=πP的$\boldsymbol{\pi }=\left( \pi _0,\pi _1,\cdots ,\pi _j,\cdots \right) ,且\pi _j\ge \text{0,}\sum_j{\pi _j}=1.求法:\boldsymbol{\pi }^T为转移矩阵\boldsymbol{P}的特征值为\lambda=1$对应的特征向量。(可能多于一个,也可能没有)
求出特征向量后注意要归一化(所有元素之和为1)。(这部分有点类似于线性代数)
求平稳分布的一个例子(2018-2019春 解答题五),转移概率矩阵P=[023013 130230 013023 230130 ] .
解:将λ=1为特征值的特征矩阵为E−P 写出,并进行初等变换:
令x4为自由变量,可得{x1=x4x2=x4x3=x4x4=x4 ,即X=x4⋅[1 1 1 1 ],基础解系只有一个线性无关的向量,将其"归一化"并转置得:
平稳分布为 π=(14,14,14,14).
几个齐次马尔可夫链模型(书上的例题):
- 伯努利独立重复试验
- 一维粒子随机游走
- 01电报机
补充
这部分内容也不知道放哪比较好,就是做往年题时记下来的一些点。
例:(18-19春 解答题三)客车载20人,一共10个车站。如果某站没人下车则客车通过该站不停车,每位乘客在各个车站下车是等可能的,且下车与否相互独立 不受别人影响。记X为停车次数,求EX。
(本题并非伯努利独立重复试验,但依旧可以采用类似于伯努利的做法,先求每个子事件,再合并)
解:设Xi表示第i站是否有人下车(是则取1否则取0),则某站没人下车的概率为P{Xi=0}=(910)20, E(Xi)=P{Xi=1}=1−(910)20,而X=∑10i=1Xi,所以EX=∑10i=1EXi=10(1−(910)20)。
某一站没人下车:即每一个人(20次方)都选择其他车站(910),所以是(910)20。
这道题的{Xi}并非伯努利独立重复序列,即i≠j 时Xi与Xj不是相互独立的,
因为P{Xi=0,Xj=0}=(810)20≠P{Xi=0}⋅P{Xj=0}=(81100)20,但是由于此题只让计算期望,而期望的可加性不需要相互独立,E(X+Y)=EX+EY,所以依旧可以拆分子事件算期望最后求和。
orz
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· Manus重磅发布:全球首款通用AI代理技术深度解析与实战指南
· 被坑几百块钱后,我竟然真的恢复了删除的微信聊天记录!
· 没有Manus邀请码?试试免邀请码的MGX或者开源的OpenManus吧
· 园子的第一款AI主题卫衣上架——"HELLO! HOW CAN I ASSIST YOU TODAY
· 【自荐】一款简洁、开源的在线白板工具 Drawnix