概率论复习笔记

X代表随机变量,x是具体的值。

规定:连续型随机变量取任意指定值的概率为0,即:P(X=a)=0

 

D(aX+b)=a2D(X)

E(aX+b)=aE(X)

无论XY是否相互独立,都有E(X+Y)=E(X)+E(Y)

当相互独立时,有E(XY)=E(X)E(Y)

当相互独立时,有D(X±Y)=D(X)+D(Y),可以通过D(aX+bY+c)=a2D(X)+b2D(Y)+2abCov(X,Y),而Cov(X,Y)=ρXYD(X)D(Y),而ρXY=0得到。

 

随便推几个式子。

总体服从N(μ,σ2),即对任意XiN(μ,σ2) 。那么根据中心极限定理i=1nXiN(nμ,nσ2),于是X=i=1nXinN(μ,σ2n)

1.1σ2i=1n(XiX)2=1σ2i=1nN2(0,n1nσ2)=1σ2i=1n(n1nσN(0,1))2

=n1ni=1nN2(0,1)=n1nN2(0,n)=N2(0,n1)=i=1n1N2(0,1)χ2(n1)

2.于是1σ2i=1n(Xiμ)2=1σ2i=1nN2(0,σ2)=i=1nN2(0,1)χ2(n)

3.n(Xμ)2σ2=nN2(0,σ2n)σ2=n(σnN(0,1))2σ2=N2(0,1)χ2(1)

4.(n1)S2σ2=1σ2i=1n(XiX)2χ2(n1)

5.n(Xμ)S=N(0,σ2)1n1i=1n(XiX)2=N(0,σ2)1n1i=1n(XiX)2=N(0,σ2)1n1σ2i=1nN2(0,n1n)=N(0,1)1n1N2(0,n1)

=N(0,1)1n1i=1n1N2(0,1)t(n1)

 

全概率公式和贝叶斯公式

BA的一个划分。

P(A)=P(AB1AB2...ABn)=P(AB1)+...+P(ABn)

=P(A|B1)P(B1)+...+P(A|Bn)P(Bn)

贝叶斯公式

P(B1|A)=P(AB1)P(A)=P(B1)P(A|B1)

 

概率密度函数f(x)

某个邻域内概率的变化快慢。概率密度函数的值是概率的变化率,概率密度函数的面积才是概率。

于是可以得知(a,b]的概率:P(a<Xb)=abf(x)dx

性质:f(x)0f(x)dx=1。这两点是判断f(x)是否是概率密度函数的充要条件。

 

已知X的概率密度函数。

Y=G(X)

FY(y)=P{Yy}=P{G(X)y}=P{G1(G(X))G1(y)}=P{XG1(y)}

=G1(y)fX(x)dx

根据x的分段点,给y做对应的分类讨论即可。

 

概率分布函数F(x)

Xx的概率之和,故又称概率累积概率函数。

于是可以得知(a,b]的概率:P(a<Xb)=F(b)F(a)

 

两者的联系

F(x)=f(t)dt

f(x)=F(x)

 

由密度函数f求分布函数F

F(x), FX(x)X的分布函数,P{Xx}都是同一概念。

一维

f(x)={0,x0ex,x>0

已知Y={2,X1X,X>1,求F(y)

F(y)=P(Yy)=P(2y,X1)+P(Xy,X>1)

={1f(x)dx,y20,y<2+{1yf(x)dx,y10,y<1

={1e1,y20,y<2+{e1ey,y10,y<1

={0,y<1e1ey,1y<21ey,y2

 

二维连续型求概率,求(X,Y)的联合分布函数,求F(x,y),求P{Xx,Yy}是同一概念。

二维:

例1.

f(x,y)={2xy,0<x<1,0<y<10,

P{X>2Y}

P{X>2Y}=D(2xy)dxdy

D是满足条件的区域即YX2f(x,y)非零区域的交集。

画图可知,结果为D(2xy)dxdy=01dx0x2(2xy)dy=724

例2.

f(x,y)={x+y,0<x<1,0<y<10,

P{Xx,Yy}

D(x+y)dxdy={x2y2+xy22,0<x<1,0<y<1x22+x2,0<x<1,y11,x1,y1y2+y22,x1,0<y<10,

 

 

由分布函数F求密度函数f

一维:求导

二维:求xy的混合偏导

 

 

由密度函数f求另一个密度函数f

一维

先求F,然后再求导得f

例1.

f(x)={0,x0ex,x>0

已知Y=2X,求fY(y)

F(y)=P{Yy}=P{2Xy}=P{Xy2}

y0F(y)=0;当y>0F(y)=0y2exdx=1ey2

f(y)={12ey2,y>00,y0

 

二维

先求F,然后再求导得f

例1.

f(x,y)={2e(x+2y),x>0,y>00,

已知Z=X+2Y,求fZ(z)

F(z)=P{Zz}=P{X+2Yz}

Yz2X2,画图可知,当z0交集为空。

F(z)=D2e(x+2y)dxdy=0z2exdx0z2X2e2ydy=1ezzezz0

于是,求导可得,f(z)={zez,z00,z<0

 

 

 

二维连续型求边缘分布函数

边缘概率分布函数的含义

FX(x)=P{Xx,Y+}=FX(x,+)

FY(y)=P{X+,Yy}=F(+,y)

例题.

设随机变量(X,Y)的分布函数:

F(x,y)=1π2(π2+arctanx)(π2+arctan2y)<x<+<y<+

于是FX(x)=1π2(π2+arctanx)(π)=12+1πarctanx

FY(y)=1π2(π2+arctan2y)(π)=12+1πarctan2y

 

二维连续型求边缘概率密度函数

fX(x)=+f(x,y)dyfY(y)=+f(x,y)dx

例1.

设区域G是由xy=0,x+y=2y=0所围成的三角形区域,二维随机变量(X,Y)的概率密度为

f(x,y)={1,(x,y)G0,

(X,Y)的边缘概率密度

fX(x)={0x1dy,0x102x1dy,1<x20,={x,0x12x,1<x20,

 

fY(y)={y2y1dx,0y10,={22y,0y10,

例2.

f(x,y)={2e(x+2y),x>0,y>00,

(X,Y)边缘概率密度fX(x)fY(y)

fX(x)={0+2exe2ydy,x>00,={ex,x>00,

fY(y)={0+2exe2ydx,y>00,={2e2y,y>00,

 

fX(x)fY(y)=f(x,y)

 

条件概率密度函数

由条件概率公式f(x|y)=f(xy)f(y)

可以推广到这里 fX|Y(x|y)=f(x,y)fY(y)f(x,y)=fX|Y(x|y)fY(y)

注意计算的时候要注意分母不能为0.

例1.

设区域G是由xy=0x+y=2y=0围成的三角形区域,二维随机变量(X,Y)的概率为

{f(x,y)=1,(x,y)G0,,求条件概率密度fX|Y(x|y)

先求出边缘概率密度fY(y)={22y,0y10,

由于分母不能为0即22y0,所以0y<1

于是fX|Y(x|y)={122y,yx2y0,

 

例2.

设随机变量X服从fX(x)={2x,0<x<10,

X=x(0<x<1)的条件下,随机变量Y服从f={12x,0<y<2x0,,求XY的联合概率密度函数f(x,y)

f(x,y)=fY|X(y|x)fX(x),而又由题意得知fY|X(y|x)=f

所以,f(x,y)={1,0<x<1,0<y<2x0,

 

一维连续型求期望

E(X)=+xfX(x)dx

E(g(x))=+g(x)fX(x)dx

D(x)=E(x2)E2(x)

二维连续型求期望

法1.先求出边缘概率密度,然后用一维方法求。

法2.求二重积分即可。

E(X)=Dxf(x,y)

E(Y)=Dyf(x,y)

均匀分布

XU[a,b]  或 XU(a,b)X[a,b](a,b)上服从均匀分布

概率密度函数f(x)={1ba,a<x<b0,

期望E(X)=xf(x)dx=1baabxdx=a+b2

方差:D(X)=E(x2)E2(x)=abx2f(x)dx(a+b2)2=a2+ab+b23(a+b2)2=(ab)212

二维:(X,Y)在区域G服从均匀分布。

P=SDSG,其中S表示面积,而D表示区域G和待求的区域的重合区域。

f(x,y)={1SD,(x,y)G0,

 

泊松分布

XP(λ)  ,X服从参数为λ的泊松分布。

分布律P(X=k)=eλλkk!,k=0,1,...,λ>0

期望E(X)=i=0ipi=i=0ieλλii!=λeλi=0λi1(i1)!=λeλeλ=λ

方差D(X)=E(X2)E2(X)=E(X(X1)+X)λ2

=i=0i(i1)λii!eλ+λλ2=i=0λ2λi2(i2)!eλ+λλ2=λ2λ2+λ=λ

 

指数分布

XE(λ)X服从参数为λ的指数分布。

P{Xab}=abf(x)dx,其中f(x)={0,x0λeλx,x>0

E(X)=1λD(X)=1λ2

P{Xa,b}=P{Xb}

 

几何分布

XGe(p),一直重复某试验直至发生某事件,每次试验概率相同且独立。设停止试验时,试验重复次数是X,则XGe(p)p表示单次试验中事件发生的的概率。

P{X=k}=(1p)k1p

E(X)=i=0i(1p)i1p=pi=0i(1p)i1

f=i=0i(1p)i1=i=0(i+1)(1p)i

(1p)f=i=0i(1p)i

于是pf=i=0(1p)i=11(1p)=1p,于是f=1p2

E(X)=pf=1p

D(X)=1pp2

 

 

超几何分布

XH(N,M,n),不放回的取,问取出某类东西数量的期望/概率。设取出的东西中有X个该类别的东西,则XH(N,M,n)

其中N=西M=,n=

P{X=k}=CMkCNMnkCNn

E(X)=nMND(X)=nM(NM)(Nn)N2(N1)

 

二项分布

XB(n,p),重复试验n次,某事出现次数为X,单次发生概率为p。试验之间相互独立。

P{X=k}=Cnkpk(1p)nk

E(X)=i=0iCnipi(1p)ni=ni=0Cn1i1pi(1p)ni

=npi=0Cn1i1pi1(1p)ni=npi=0Cn1ipi(1p)ni1

=np

D(X)=np(1p)

如果题目求某个范围的概率,计算量大,那么用XN(np,np(1p))

limnP{Xnpnp(1p)x}=ϕ(x)

 

特殊情况,01分布,即n=1时的二项分布。

XB(1,p),期望为p,方差为p(1p)

 

正态分布

XN(μ,σ2)X服从μ(均值)为多少,σ(标准差)或σ2(方差)为多少的正态分布

注意σ>0

f(x)=12πσe(xμ)22σ2<x<+

标准正态分布函数ϕ(a)=a12πex22dx

ϕ(x)=12πex22,即与标准正态分布的概率密度函数相等。

ϕ(a)+ϕ(a)=1ϕ(0)=0.5ϕ(+)=1ϕ()=0

ϕ(a)>ϕ(b),则a>b

标准正态分布:N(0,1)ϕ(x)=P{Xx}

 

aX+cN(aμ+c,a2σ2)

XN(μ1,σ12)YN(μ2,σ22),且XY相互独立,则aX+bY+cZN(aμ1+bμ2+c,a2σ12+b2σ22)

XN(α,β),那么XαβN(0,1)

 

结论: +x12πσe(xμ)22σ2=μ+x212πσe(xμ)22σ2=μ2+σ2

证明: 由于+x12πσe(xμ)22σ2=E(X)=μ+x212πσe(xμ)22σ2=E(X2)=D(X)+E2(X)=σ2+μ2

 

例题1.

+12πxe2xx22dx=+12πxex2+4x4+42dx=+12πxe(x2)22+2dx

=e2+12πxe(x2)22edx=2e2

例题2.

+12πx2e4xx22dx=+12πx2ex2+8x16+162dx

=e8+12πx2e(x4)22dx=17e8

 

 

二维正态分布

(X,Y)N(μ1,μ2;σ12,σ22;ρ)

(X,Y)服从参数为μ1,μ2(均值),σ1,σ2(标准差/均方差),ρ(相关系数)的二维正态分布。

f(x,y)=12π1ρ2σ1σ2e12(1ρ2)[(xμ1)2σ12+(yμ2)2σ222ρ(xμ1)(yμ2)σ1σ2],其中1<ρ<1

XN(μ1,σ12)YN(μ2,σ22)时,(a1X+c1,a2Y+c2)不一定服从二维正态分布。其中a1,a2,c1,c2可为任意常数。

(X,Y)N(μ1,μ2;σ12,σ22;ρ),则

1.XN(μ1,σ12)YN(μ2,σ22)

2.a,b不全为0时,aX+bY+cN(aμ1+bμ2+c,a2σ12+b2σ22+2ρabσ1σ2)

3.abcd时,(aX+bY,cX+dY)也服从二维正态分布。

4.ρ=0XY不相关时,XY相互独立,此时P{XabYcd}=P{Xab}P{Ycd}

 

 

常见分布的数字特征

XY相互独立,那么D(X+Y)=D(X)+D(Y)

否则D(X+Y)=D(X)+D(Y)+2Cov(X,Y)

D(aX+bY+c)=a2D(X)+b2D(Y)+2abCov(X,Y)

 

协方差Cov(X,Y),即两个随机变量情况下的方差。

性质:

1.Cov(X,Y)=E(XY)E(X)E(Y)

2.ρXY=Cov(X,Y)D(X)D(Y)=Cov(X,Y)σXσY

3.Cov(X1±X2,Y)=Cov(X1,Y)±Cov(X2,Y)

4.Cov(aX,bY)=abCov(X,Y)

 

3,4均可以由1推出

 

相关系数的性质

Y=aX+b ,如果a>0ρXY=1,如果a<0ρXY=1

 

 

不相关,相互独立时的期望、方差。

 

XY相互独立,可以推出XY不相关。反之不成立。

XY不相关即ρXY=0 Cov(X,Y)=0 E(XY)=E(X)E(Y) D(X±Y)=D(X)+D(Y) (注意这里无论如何都是+),其中XY分别可以换成任意未知数只含XY的项。

 

(X,Y)服从二维正态分布时,XY不相关(ρXY=0 XY相互独立

(X,Y)不服从二维正态分布时,XY不相关(ρXY=0 XY相互独立

 

切比雪夫不等式

P{|XE(X)|ε}D(X)ε2

 

辛钦大数定律

要求:独立同分布。随之而来就有期望和方差相同。

limn+P{|1ni=1nXi1ni=1nE(Xi)|<ε}=1

 

 

中心极限定理

X1,X2,...,Xn独立同分布。

i=1nXiN(E(i=1nXi),D(i=1nXi))=N(nE(X),nD(X))  。

这里的服从是近似服从。n越大越近似。

计算P{i=1nXix},需要先把i=1nXi标准化,变成P{i=1nXinE(X)nD(X)xnE(X)nD(X)}

此时由于不等式左边服从标准正态分布N(0,1),所以答案即为ϕ(xnE(X)nD(X))

 

 

统计量

X(1)X(n)F(1)(x)F(n)(x)

最小观测量X(1)=min{X1,X2,...,Xn},其分布函数F(1)(x)=1[1F(x)]n

最大观测量X(n)=max{X1,X2,...,Xn},其分布函数F(n)(x)=F(x)n

 

判断统计量:除了XSn以外,还有其他未知字母的量不是统计量。

 

样本均值X=X1+X2+...+Xnn

样本方差S2=(X1X)2+(X2X)2+...+(XnX)2n1

样本标准差S=S2

除以n1是为了保证标准差是对总体标准差的无偏估计。

总体方差σ2=(X1X)2+(X2X)2+...+(XnX)2n

总体标准差σ=σ2

XS相互独立

 

 

卡方分布

Xχ2(n)

X=X12+X22+...+Xn2XiN(0,1),

E(X)=nD(X)=2n

图像:从原点出发,先增后减。

α分位点:如果后面的阴影部分面积为α,那么就是χα2(n)

满足可加性:X1χ2(n)X2χ2(m)。并且相互独立,则X1+X2χ2(n+m)

 

t分布

Xt(n),则X=X1X2n (其中X1N(0,1)X2χ2(n) ,相互独立)

图像:类似于标准正态分布

α分位点:如果后面的阴影部分面积为α,那么就是tα(n)

 

F分布

XF(n,m),则X=X1nX2m,(其中X1χ2(n),X2χ2(m),相互独立)

图像:类似于χ2的图像。

α分位点:如果后面的阴影部分面积为α,那么就是Fα(n,m)

 

 

矩估计法

E(Xk)k阶原点矩(简称k阶矩)。

E([XE(X)]k)Xk阶中心矩

均值是一阶矩(原点矩),方差是二阶中心矩。

E(XkYL)XYK+L阶混合(原点)矩。

E([XE(X)]K[YE(Y)]L)XYK+L阶混合中心矩。

协方差是二阶混合中心矩。

思想:n较大时,样本矩=总体矩。比如求一阶样本矩和一阶总体矩,就是样本均值和总体均值。令它们相等即可。求得的θ^即为θ的矩估计量。

 

 

最大似然估计法

思想:使得样本x1,x2,...,xn发生的概率最大的θ值最恰当。

第一步:写出样本似然函数:L(x1,x2,...,xn;θ) ,离散型则是这n个概率的相乘,连续型则是密度相乘。

第二步:取对数,ln(L(θ)) 。然后求驻点θ^即为θ的最大似然估计。

 

估计量的无偏性:E(θ^)=θ,则称θ^θ的无偏估计。

估计量的有效性:θ1,θ2均为θ的无偏估计,且D(θ1)<D(θ2),则称θ1θ2更有效。

 

置信度:1α,落在中间的概率(置信区间)是是1α

 

μ的区间估计

若方差σ2已知,则用xμσnN(0,1) 然后计算 [zα2,zα2]

若方差σ2未知,则用xμsnt(n1) 然后计算[tα2(n1),tα2(n1)]

 

σ2的区间估计

若方差μ未知,则用(n1)S2σ2χ2(n1) 然后计算[χ1α22(n1),χα22(n1)]

 

 

 

 

假设检验

第一步:提出假设,H0:μ=μ0H1:μμ0

第二步:

检查均值μ

若方差σ2已知,则用xzσnN(0,1)      (U)

若方差σ2未知,则用xzsnt(n1)    (T)

 

检查方差σ2

(n1)S2σ2χ2(n1)     (χ2)

 

第三步:拒绝域:小概率事件对应的区间(就是两边的区域)

检查均值μ

若方差σ2已知,则用W=(,zα2)(zα2,+) 

若方差σ2未知,则用W=(,tα2(n1))(tα2(n1),+) 

 

检查方差σ2

W=(0χ1α22(n1))(χα22(n1),+) 

 

第四步:做出检验

代入x,S,σ2得统计量的值,若该值W,则拒绝H0

 

posted @   mrsunss  阅读(29)  评论(0编辑  收藏  举报
相关博文:
阅读排行:
· 无需6万激活码!GitHub神秘组织3小时极速复刻Manus,手把手教你使用OpenManus搭建本
· Manus爆火,是硬核还是营销?
· 终于写完轮子一部分:tcp代理 了,记录一下
· 别再用vector<bool>了!Google高级工程师:这可能是STL最大的设计失误
· 单元测试从入门到精通
点击右上角即可分享
微信分享提示