鞅
一些定义:
- 随机过程:依赖于参数的一组随机变量的全体,参数通常是时间。即假设 T 是指标集,且对于任意 t∈T,Xt 都是一随机变量,那么我们就可以称 {Xt|t∈T} 为一随机过程。
- 条件概率:P(A|B),表示事件 A 在事件 B 发生的条件下发生的概率。
- 独立同分布:对于随机变量 X1,⋯,Xn,若它们服从同一分布,并且互相独立,就称这些变量独立同分布。
- Var(X):为随机变量 X 的方差,等于 E((X−E(X))2),展开后也等于 E(X2)−E(X)2。
接下来介绍鞅的定义,一种最基础的鞅的定义是:
称离散随机过程 {X0,X1,⋯} 是鞅,若对于任意的 n 都满足:
-
E(|Xn|)<∞。
-
E(Xn+1|Xn,⋯,X0)=Xn。
这里 Xn,⋯,X0 作为条件概率里的条件,意思是假设随机变量 Xn,⋯,X0 已经确定了。即其等价于:∀x0,x1,⋯,xn,E(Xn+1|Xn=xn,⋯,X0=x0)=Xn。
一个扩展一点的定义:
称离散随机过程 {Y0,Y1,⋯} 关于随机过程 {X0,X1,⋯} 是鞅,若对于任意的 n 都满足:
- E(|Yn|)<∞。
- E(Yn+1|Xn,⋯,X0)=Yn。
注意,第二个条件意味着 Yn 仅可能与 Xn,⋯,X0 有关,即在 Xn,⋯,X0 确定的情况下,Yn 也是确定的。
观察鞅的定义,我们可以得到这么一个结论:假设 Yn 是关于 Xn 的鞅,那么 ∀t,E(Yt)=E(Y0)。
但注意这个结论并不和鞅定义中第二个条件等价,鞅定义中的第二个条件会比这个结论更加严格。
除此之外还有上鞅和下鞅:如果鞅的第二个条件中的符号变为 ≤ 则称其为上鞅;如果变为 ≥,则称其为下鞅。注意这和 “上”、“下” 的直觉相反。
一道例题:
考虑一个简单的随机游走过程,即 Sn=∑nk=1Xk,且 P(Xi=1)=P(Xi=−1)=12。
-
求证:Sn 是一个关于 Xn 的鞅。
证明:第一个条件:E(|Sn|)≤n<∞。
第二个条件:E(Sn+1−Sn|Xn,⋯,X0)=E(Xn+1|Xn,⋯,X0)=E(Xn+1)=0。
-
求证:Yn=S2n−n 是一个关于 Xn 的鞅。
证明:第一个条件:E(|S2n−n|)≤E(S2n)≤n2<∞。第二个条件:
E(Yn+1−Yn|Xn,⋯,X0)=E((S2n+1−(n+1))−(S2n−n)|Xn,⋯,X0)=E(S2n+1−S2n−1|Xn,⋯,X0)=12((Sn+1)2+(Sn−1)2)−S2n−1=0
鞅的停时定理
一些定义:
-
几乎一定:一个事件 A 几乎一定会发生当且仅当事件 A 发生的概率为 1。即 A 不发生的情况集合可能是非空的,但它们对应的概率为 0。在样本空间有限时,“几乎一定” 和 “一定” 通常没有区别。但在样本空间无限时,这种区别变得非常重要,因为无限集可以有出现概率为 0 的非空子集。
例子:在 [0,1] 中任选一个实数,选出的数几乎一定大于 0。
下面可能还要注意 “趋近于” 和 “等于” 的区别:比如 0 乘任何数一定是 0(注意 ∞ 不是 “数”),但一个趋近于 0 的数乘上一个趋近于 ∞ 的数我们不知道它是什么。
-
停时:关于随机过程 {X0,X1,⋯} 的停时是一个非负的随机变量 T(可能为 ∞),满足对于任意的 n,[n=T] 的取值仅与 X0,⋯,Xn 有关。直观地说,对于任意的时间 n,你可以仅通过 X0,⋯,Xn 判断 T,n 的大小关系(当然若 T≤n,你也可以得到 T 的具体取值)。
-
带停时的随机过程:对于随机过程 {X0,X1,⋯,},设其停时为 T,定义该随机过程所对应的带停时的随机过程 {¯X0,¯X1,⋯}:
¯Xn={Xn,n≤TXT,n>T
当然,一些文章中可能会直接用 Xmin(n,T) 代替 ¯Xn。
直观地说,{¯X0,¯X1,⋯} 就是把 {X0,X1,⋯} 改成在停时之后维持不变的结果。
注意停时 T 只是一个关于 {X0,X1,⋯,} 的函数,并不是说一个随机过程有停时它就是带停时的。
我们可以证明某个鞅带停时后也是一个鞅:
-
引理 1:设 Yn 是一个关于 Xn 的鞅,那么 ¯Yn 也是一个关于 Xn 的鞅。
证明:我们只需要证明 E(¯Yn+1|Xn,⋯,X0)=¯Yn 即可。
注意 Xn,⋯,X0 是已知的,所以我们可以得到 T,n 的大小关系:
- 若 T≤n,则 ¯Yn+1=¯Yn。
- 若 T>n,则 E(¯Yn+1|Xn,⋯,X0)=E(Yn+1|Xn,⋯,X0)=Yn=¯Yn。
直观地说,对于那些未到停时的过程它们原来就是期望不变的,对于那些已经到停时的过程由于我们已经钦定它们不变了,所以它们也是期望不变的。
推论:⋯=E(¯Y1)=E(¯Y0)=E(Y0)=E(Y1)=⋯。直观上也很容易解释。
接下来介绍鞅的停时定理:
设 {Y0,Y1,⋯} 是一个鞅,T 是其停时,且 T 几乎一定有限(P(T<∞)=1),若有下列条件之一成立,则有 E(YT)=E(Y0):
-
T 几乎一定有界,即存在一个常数 K 使得 P(T≤K)=1。
证明:
E(YT)=P(T≤K)E(YT|T≤K)+P(T>K)E(YT|T>k)=E(YT|T≤K)=E(¯YK)=E(Y0):
一些帮助理解的例子:
- 数轴上从 0 开始向右游走,每次走长度 1 或长度 2,走到当前位置大于等于特定常数 S 为止。这个是 T 有界的例子。
- 从 [0,1] 中每次随机选一个实数,直到选出非 0 数为止。这是 T 不有界但几乎一定有界的例子。
- 每次抛一枚硬币,直到抛出反面位置。这是 T 不几乎一定有界的例子。因为对于任意的 K,P(T>K)=12K,而即使是 K 趋近于 ∞ 时,P(T>K) 也只是趋近于 0,而不等于 0。
-
¯Yn 几乎一定有界,即存在一个常数 K 使得 P(|¯Yn|≤K)=1。
证明:
E(YT)=limn→∞P(T≤n)E(YT|T≤n)+P(T>n)E(YT|T>n)=limn→∞P(T≤n)E(¯Yn|T≤n)+P(T>n)⋅O(1)=limn→∞P(T≤n)E(¯Yn|T≤n)=limn→∞E(¯Yn)−P(T>n)E(¯Yn|T>n)=limn→∞E(¯Yn)−P(T>n)⋅O(1)=limn→∞E(¯Yn)=E(Y0)
一些帮助理解的例子:
- 数轴上从 0 开始随机游走,每次等概率向左或向右移动 1,走到 −m 或 m 为止。那么第 n 步之后的位置 Sn 肯定有界 [−m,m]。
-
E(T) 有限。且 E(|Yn+1−Yn|) 几乎一定有界,即存在一个常数 K 使得 P(E(|Yn+1−Yn|)≤K)=1。
证明:
limt→∞E(YT−Yt)=limt→∞P(T>t)E(YT−Yt|T>t)=limt→∞∞∑i=tP(T>i)E(Yi+1−Yi|T>i)≤limt→∞∞∑i=tP(T>i)K=Klimt→∞∞∑i=tP(T>i)=Klimt→∞∞∑i=tP(T=i)(i−t)≤Klimt→∞∞∑i=tP(T=i)i
考虑设 Sn=∑ni=0P(T=i)i,显然数列 Sn 趋近于数 E(T),那么 E(T)−Sn 趋近于 0,所以上式等于 0。故:
E(YT)=limt→∞E(Yt)=E(Y0)
一些帮助理解的例子:
- 首先注意前提条件中的 P(T<∞)=1 并不代表着 E(T)<∞。比如我们这么构造停时为 i 的概率:P(T=i)=pi=6π2⋅1i2,显然 ∑i≥0pi 收敛于 1,所以 P(T<∞)=1。但如果我们要求 E(T)=∑i≥0pii=6π2∑i≥01i,会发现它并不收敛,而是发散的。
讲一个应用的例子吧:
CF1349D Slime and Biscuits
题意:
有 n 个人,每个人拥有 Ai 块饼干。
每次随机将一块饼干等概率分给除了其所有者以外的人。
求第一次出现有一个人拥有所有饼干的所需的期望次数。
做法:
停时与 a 序列有关,我们考虑构造一个鞅,同时携带了 A 序列和时间这两个信息。
我们大胆地猜想,我们可以构造一个关于 A 序列的函数 F(A) 使得 Yt=F(At)+t 为鞅。进一步的猜想是令 F(A)=∑ni=1f(ai)。
那么我们就需要满足:
E(Yt+1−Yt|At)=0
展开后得到:
1+n∑i=1(m−At,im⋅n−2n−1−1)f(At,i)+At,imf(At,i−1)+m−At,im⋅1n−1f(At,i+1)=0
一个技巧是把 1 拆到里面去:
n∑i=1(m−At,im⋅n−2n−1−1)f(At,i)+At,imf(At,i−1)+m−At,im⋅1n−1f(At,i+1)+At,im=0
注意到这个式子对于 At 为任意序列都成立,所以为了不失一般性,我们应该令:
(m−xm⋅n−2n−1−1)f(x)+xmf(x−1)+m−xm⋅1n−1f(x+1)+xm=0
对于任意的 x∈[0,m]。
解出 f 即可,可以做到 O(m)。那么 E(T)=E(F(AT)+T)−E(F(AT))=E(YT)−E(F(AT))=E(Y0)−E(F(AT)).
至于为什么这个鞅能用鞅的停时定理,我们可以发现它满足 E(|Yt+1−Yt|) 有界,但 E(T)<∞ 这个我不会证。(但既然题目都让你求它了那它肯定就是有限的)
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· 分享一个免费、快速、无限量使用的满血 DeepSeek R1 模型,支持深度思考和联网搜索!
· 基于 Docker 搭建 FRP 内网穿透开源项目(很简单哒)
· ollama系列01:轻松3步本地部署deepseek,普通电脑可用
· 25岁的心里话
· 按钮权限的设计及实现