返回顶部

【概率论】保姆级教学

 


作者:@魔幻世界魔幻人生
本文为作者原创,转载请注明出处:https://www.cnblogs.com/subtlemaple/p/16618339.html


概率论

1.条件概率

  • P(AB)=P(A)+P(B)P(AB)P(A)+P(B)

  • 条件概率公式 P(A|B)=P(AB)P(B)

条件概率:在 B 事件基础上 A 发生的概率。公式中相当于把 B 当做单位 1,在 B 的空间中看待 A 的概率。(如下图)

  • 对于独立事件 AB , P(AB)=P(A)×P(B)
  • 交换律 AB=BA

贝叶斯定理

(1) P(A|B)=P(B|A)×P(A)P(B)

证明过程:P(AB)=P(A|B)×P(B)=P(BA)=P(B|A)×P(A)

P(B)=P(BA)+P(B¬A)

所以此公式的终极形态就是:

(2)P(A|B)=P(A)×P(B|A)P(A)×P(B|A)+P(¬A)×P(B|¬A)

如何从几何意义上理解这个公式?

B 条件下 A 发生的概率,相当于在整个概率空间中发生了 B, 且同时发生了 A 的概率。

公式相当于 XX+Y ,其中 X 就是 AB

小例题

已知新冠在人群中发病率 0.1% , 核酸检测误判概率为 1% ,求证一个人在核酸阳性时真正患病的概率。

解:

可以套用贝叶斯定理,令 A 为患病, B 为阳性,则题目所需为 P(A|B)

由题意知:P(A)=0.1% , P(¬A)=99.9% , P(B|A)=99% , P(B|¬A)=1%

由贝叶斯定理得结果为 11/1229.6%

离散随机变量

随机变量定义

离散随机变量 X 是一个样本空间到实数的映射,实数作为事件的价值,它就像随机数生成器随机生成的结果。

对于 X 和 实数 x ,定义 X=x{sS:X(s)=x} ,即所有标号为 x 的事件的集合。

譬如,骰子抛出3这个事件就是 X=3

f(x)=Pr{X=x}X概率密度函数,满足 xPr{X=x}=1

若定义 XY 两个随机变量,则:

Pr(x,y)=Pr{X=xY=y}

Pr(x)=yPr{X=xY=y}

随机变量期望

定义

期望实际就是所有随机变量在样本空间中的平均值X期望值是:

(3)E[x]=xxPr{X=x}

一般用 μx 表示 E[x]

期望的线性性质

E[x+y]=E[x]+E[y]

即使 X,Y 不独立,该公式仍然成立

期望与函数
  • X 是随机变量 ,给出任意函数 g(x) ,定义一个新的随机变量 g(X) ;若 g(X) 的期望有定义,则:

(4)E[g(X)]=xg(x)Pr{X=x}

  • g(x)=ax,则对于任意常数 a

(5)E[ax]=aE[x]

  • 当两个随机变量 X,Y 独立时:

    E[XY]=xPr{X=x}yPr{Y=y}=E[x]E[y]

  • 当随机变量 X 在自然数N 上取值时,期望计算公式:

    E[x]=i=0iPr{X=i}=i=0i(Pr{Xi}Pr{Xi+1})=i=1Pr{Xi}

    Pr{X=0} 外的每个 Pr{Xi} 都被加了 i 次,减了 i1 次。

  • 凸函数与期望

    (下)凸函数定义:

    对于任意 x,y,λ[0,1], 有 f(λx+(1λy))λf(x)+(1λ)f(y),则 f(x) 是凸函数。

    假定期望存在且有限,由詹姆斯不等式得:

    E[f(x)]f(E[x])

方差与标准差

  • 方差在数学上表达了一个随机变量可能离均值有多远。均值为 E[X] 的随机变量的方差为:

    Var[X]=E[(XE[X])2]=E[X22E[X]X+E2[X]]=E[X2]2E[E[X]X]+E[E2[X]]=E[X2]2E2[X]+E2[X]=E[X2]E2[X]

    注意,由于 E2[X] 是实数,所以 E[E2[X]]=E2[X] 。重写上式得到随机变量平方的期望表达式:

    E[X2]=Var[X]+E2[X]

  • X 的方差与 aX 的方差关系为:

Var[aX]=a2Var[X]

  • XY 互相独立时:

Var[X+Y]=Var[X]+Var[Y]

  • 随机变量 X标准差Var[x]

概率期望练习

C31

抛出两枚骰子,其中较大值的期望为多少?

solution: 设最大值为 i , 则两个值都在 1i 的概率为 (i6)2 ,两个都在 1i1 的概率为 (i16)2 ,则其中至少有一个是 i 的概率就是 (i2(i1)236)=i2136 ,故期望为 i=16i(2i1)36

C33

3 枚骰子,选择一个点数并抵押 1 RMB,三个骰子中有 k 个与所选点数相同,则奖励 k 人民币,若 k=0 ,则输掉自己的 1 RMB,问期望收入。

solution: 假设有 i 个骰子猜中,则一共有 (3i) 种情况,概率为 (16)i(56)3i ,结果就是 i=13i(3i)(16)i(56)3i

C36

X 是非负随机变量,且 E[X] 有定义,对于任何 t(0,+] 证明马尔可夫(Markov)不等式

Pr{Xt}E[X]/t

solution:

E[X]=i=0iPr{X=i}i=tiPr{X=i}i=ttPr{X=i}=tPr{Xt}

Markov 不等式可以松散地确定尾部事件的概率上界,一个直观的例子是:假如一公司的平均工资是 μ ,则工资高于 nμ 的人数不超过 1n

切比雪夫(chebyshev)不等式,对于任意 d>0 ,有两种形式:

Pr{|Xμx|d}Var[X]d2Pr{|Xμx|σd}1d2

可用Markov 不等式证明它的各种形式:

Pr{|Xμx|d}=Pr{|Xμx|2d2}E[(XE[X])2]d2=Var[X]d2Pr{|Xμx|σd}=Pr{|Xμx|2σ2d2}E[(Xμx)2]σ2d2=1d2

第二种形式表明,随机变量距离期望值有至少 d 个标准差的概率不超过 1d,这表明随机变量多分布于期望值附近。

C38

比较 E[X]2E[X2] 大小。

solution:

E[X2]E[X]2=Var[X]0

C39

X 取值仅为 0 或者 1,证明: Var[X]=E[X]E[1X]

solution:

f(0)=E[1X],f(1)=E[X],f(0)+f(1)=1σ2(X)=f(0)(0E[X])2+f(1)(1E[X])2=f(0)E2[X]+f(1)E2[X]2f(1)E[X]+f(1)=E2[X]2E2[X]+E[X]=E[X]E2[X]=E[X](1E[X])=E[X]E[1X]

通过方差与期望平方的关系,还有更优雅的方法: X2=X

Var[X]=E[X2]E2[X]=E[X]E2[X]=

C310

证明:Var[aX]=a2Var[X]

solution:

Var[aX]=E[a2X2]E2[ax]=a2E[X2]a2E2[X]=a2Var[X]

几何分布与二项分布

几何分布

定义:

相同条件下互相独立进行多次实验,k 次才获得成功,则 k 与其概率满足几何分布

p 为成功概率, q=1p 为失败概率。

期望:

E[X]=k=1kqk1p=pqk=0kqk=pqq(1q)2=pqqp2=1p

方差:

未完待续

posted @   魔幻世界魔幻人生  阅读(121)  评论(0编辑  收藏  举报
相关博文:
阅读排行:
· 地球OL攻略 —— 某应届生求职总结
· 周边上新:园子的第一款马克杯温暖上架
· Open-Sora 2.0 重磅开源!
· 提示词工程——AI应用必不可少的技术
· .NET周刊【3月第1期 2025-03-02】
点击右上角即可分享
微信分享提示