Markov Chain

Chang J. Markov Chain.

符号说明

  • S={1,2,,N}, 状态空间;
  • X, 定义在状态空间 S 之上的随机变量;
  • π0,π0(i):=P(X0=i), 各初始状态的概率 (行向量);
  • PRN×N,Pij:=P(Xn+1=j|Xn=i), 转移概率;
  • πn+1=πnP 为第 n+1 步后的状态概率;
  • Tj, 从状态X0 开始第一次落在状态 j所用步数.

基本概念

马尔可夫链

马尔可夫性: 称随机过程 X0,X1, 满足马尔可夫性, 如果

P(Xn+1=in+1|Xn=in,,X0=i0)=P(Xn+1=in+1|Xn=in)

Stationary distributions

满足下列等式的分布成为马氏链的平稳分布:

π=πP.

π(j)=iSπ(i)P(i,j).

例子

  • Ehrenfest Chain: 设想有 0,1,,d 区域, 每个区域往旁边两个区域的转移概率为

P(i,i1)=i/d,P(i,i+1)=(di)/d,

则平稳分布为

π=12d(Cd0,Cd1,,Cdd).

  • S={1,2,}, 且

P(i,i+1)=1,

不存在平稳分布.

  • S={1,2,}, 且

P(i,i1)=1/2=P(i,i+1),

则有

π(j)=12π(j1)+12π(j+1),

可以发现, 理论上应该是

π=1Z(1,2,3,)

显然不存在这样的常数Z成立, 故也不存在平稳分布.

probability flux

从子集 A 到子集 B 的 flux 定义为

flux(A,B)=iAjBπ(i)P(i,j)=iAπ(i)jBP(i,j)=iAπ(i)P(XnB|Xn1=i)=P(XnB,Xn1A)

显然有如下性质

  1. 线性性质

flux(A,BC)=flux(A,B)+flux(A,C),flux(BC,A)=flux(B,A)+flux(C,A).

  1. 对于 {k}:

flux(S,{k})=flux({k},S)=π(k).

  1. 于是对于任意子集 A:

flux(S,A)=flux(A,S)=iA=π(i).

  1. 最后, 有

flux(A,AC)=flux(A,S)flux(A,A)=flux(AC,A)

成立.

不可约性 (irreducibility)

  • Pi(A):=P(A|X0=i), 类似的 Ei.

可达

可达: 称状态 i 可达 状态 j, 如果

Pi{n=0{Xn=j}}>0,

或等价地,

n=0Pn(i,j)=n=0Pi{Xn=j}>0.

定义

不可约: 我们称马氏链是不可约的, 若对于其中任意状态 i,j, 都是互相可达的.

注: 实际上, 可以将互相可达(communicating)看成一个关系, 可以将状态分成若干等价类, 类内互相可达, 类间不互相可达. 显然不可约即只有一个等价类.

例子

  • 对于任意 π0, 假设

P=(1001),

显然有 π0=π0P, 此时任意的先验 π0 都是平稳分布的.

周期性 (periodicity)

周期: 给定马氏链 {X0,X1,}, 定义状态 i 的周期为(最大公约数)

di=gcd{n:Pn(i,i)>0}.

互相可达周期一致定理

定理: 如果状态 i,j 互相可达, 则 di=dj.


proof:

由于 di=dj 互相可达, 则存在

Pn1(i,j)>0,Pn2(j,i)>0,

d1|n1+n2.

对于任意 n{n:Pn(j,j)>0}, 有

d1|n1+n+n2,

d1n{n:Pn(j,j)>0}的公约数, 即

d1|d2,

反之可得

d2|d1.

d1=d2.


定义

不可约的马氏链是非周期性 (aperiodic) 的, 如果它的周期为1, 否则称其为周期性 (periodic) 的.

例子

  • 对于任意 π0=(p,q), 假设

P=(0110),

改马氏链不可约, 其周期为2, 显然n为奇数是

πn=(q,p),

偶数时

πn=(p,q),

故这种情况下分布是不收敛的.

常返 (reurrence)

定义

常返: 状态 i 是常返的, 如果

Pi(Ti<+)=1,

其中

Ti=inf{n>0:Xn=i},

为从 i 首次回到 i 的时间, 否则称为非常返 (transient) 的.

显然常返的含义就是, 状态 i 在有限时间内一定会返回到自身. 注意和可达的区分, 可达只是回答了能不能从某个状态到另一个状态, 其相当于是 (0!)

Pi(Tj<+)>0,ij.

注: 我们来理解下

Pi(Ti<+)=1,

假设

Pi(Ti<n)=11n,

limnPi(Ti<n)=1.

但是我们找不到一个固定的 N, 使得

Pi(Ti<N)=1.

定理1.24: 假设 i 是常返的且可达 j, 则

  1. Pi(Tj<+)=1;
  2. Pj(Ti<+)=1;
  3. 状态 j 也是常返的.

定理1.25: 状态 i 是常返的, 当前仅当

Ei[Ni]=,

其中

Ni=n=0I(Xn=i).


proof:

如果 i 是常返的, 则

Pi(Ni=)=1,

故期望为 .

可通过反证法, 此时假设

q:=Pi(Ti=)>0.

假设从 i 出发第一次回到 i 的路径记为 cycle R, 整个过程可能有

c=0,1,2,

个这样的 cycles. 显然

P(c=0)=q.

因为回到 i 之后的路径和之前的路径是独立的, 故

P(c=k)=(1q)kq,

实际上是一个成功率为 q 的几何分布. 而 Ni=c+1,

E[Ni]=1q+1.


推论1.26: 如果 j 是非常返的, 则 limnPn(i,j)=0,i.

命题1.30: 假设马氏链有平稳分布 π, 如果状态 j 是非常返的, 则 π(j)=0.


proof:

既然

π(j)=iπ(i)Pn(i,j),

而通过推论1.26可知

Pn(i,j)0.


推论1.32: 如果不可约的马氏链具有平稳分布, 则该链是常返的(所有状态).


proof:

由定理1.24可知, 不可约的马氏链要么都是常返的, 要么都是非常返的, 而如果是非常返的, 由上述命题1.30又可知 π(i)=0,i, 此时不符合分布的条件.


Basic Limit Theorem

Basic Limist Theorem:X0,X1,不可约的, 非周期的马氏链且具有平稳分布 π. X0 的初始分布为任意 π0, 有

limnπn(i)=π(i),iS.


证明思路 (非常有意思):

  1. 证明

πnπTVP(T<n),T:=inf{n:Xn=Yn},Y0π.

于是只需证明 P(T<n)0;
2. 构建 Z:=X,Y, 此时只要

P(TZ(j)<n)0,jTZ(j):=inf{n:Zn=(j,j)}.

  1. 可证明一个充分条件: Z0,Z1, 是不可约的常返的;
  2. 因为 Z 有平稳分布 π(i)π(j), 故只需证明 Z 是不可约的 (推论1.32);
  3. 通过非周期性证明存在 N, Pn(i,i)>0,n>N, 再有 X,Y本身的不可约可得

Pn(i,j)>0,n>N.

  1. Z的转移概率记为 PX(i,j)PY(i,j), 不可约证毕.

强大数定律之于马氏链

这里只记录结果:

定理1.39: 假设马氏链 X0,X1, 从状态 X0=i 出发, 且状态 i 可达状态 j, 则

Pi{limn1nt=1nI{Xt=j}=1Ej[Tj]}=1.

推论1.40: 对于不可约的马氏链, 有

limn1nt=1nPt(i,j)=1Ej[Tj](i,j).

定理1.41: 不可约的马氏链若同时为 positive recurrent (Ej(Tj)<), 则其存在唯一的平稳分布

π(j)=1Ej(Tj).

性质

  1. X0,X1,为一马氏链:

P(X2B|X1=x1,X0A)=P(X2B|X1=x1)P(X2B|X1A,X0=x0)P(X2B|X1A).

后者不成立的反例考虑 A=S 即可.

  1. X0,X1,为一马氏链, i<j<k:

P(Xj|Xi)P(Xk|Xj)=P(Xk,Xj|Xi).

既然 P(Xk|Xj)=P(Xk|Xj,Xi).

未完待续...

posted @   馒头and花卷  阅读(556)  评论(0编辑  收藏  举报
相关博文:
阅读排行:
· winform 绘制太阳,地球,月球 运作规律
· AI与.NET技术实操系列(五):向量存储与相似性搜索在 .NET 中的实现
· 超详细:普通电脑也行Windows部署deepseek R1训练数据并当服务器共享给他人
· 【硬核科普】Trae如何「偷看」你的代码?零基础破解AI编程运行原理
· 上周热点回顾(3.3-3.9)
历史上的今天:
2019-05-14 matplotlb 进阶之Styling with cycler
点击右上角即可分享
微信分享提示