时间可逆的马氏链(Time Reversible Markov Chain)

逆向过程

考虑一个具有转移概率Pij和平稳概率πi的已经达到平稳状态的遍历的(不可约+非周期+正常返)马尔科夫链。假设这个马氏链在平稳态的状态序列是{Xm,Xm+1,}, 现在我们沿时间的反方向来看这条链,具体地,我们希望考察
P(Xm=j|Xm+1=i,Xm+2,)
因为在这个马氏链的正向过程中有XmXm+2,是相互独立的,所以在逆向过程中结合上式有
P(Xm=j|Xm+1=i,Xm+2,)=P(Xm=j|Xm+1=i)
这个式子说明遍历的马氏链在达到平衡态之后沿着时间的反方向的过程也是一个马氏链。接着自然要考虑这个马氏链的转移概率Qij根据马氏链的平稳概率以及条件概率公式易得
Qij=P(Xm=j|Xm+1=i)=πjPjiπi

时间可逆的马氏链

一个马氏链的逆向过程其实并不特殊,但是如果满足Qij=Pij,那么马氏链就特殊起来了,这种马氏链可以称为时间可逆的,且根据这个条件我们可以进一步时间可逆马氏链的一个条件
πiPij=πjPji
这个条件可以帮助我们在后面得出时间可逆马氏链的充要条件。现在来思考一下为什么Qij=Pij时,马氏链被称为是时间可逆的,Qij=Pij表达的是在反向过程中后一个时间点状态i到前一个时间点状态j的概率等于正向过程中前一个时间点状态i到后一个时间点状态j的概率,这个结论对任意i,j都成立,就好像时间这个因素对状态之间的转移概率没有影响一样,不管是正向还是逆向过程,只要是状态i转移到状态j, 这个转移概率就不变,状态之间的转移概率不同完全取决于状态本身。由于目前来看,时间只有两种方向(过去(逆向),未来(正向)), 所以对于上面那种不受时间影响的说法也可以说是时间可逆。

我们得到了一个判断马氏链是否是可逆的充分条件,即πiPij=πjPji。实际上如果我们能够找到一组非负数使得它满足方程
xiPij=xjPjiixi=1
那么对应的马氏链是时间可逆的,并且得到的解就是该马氏链的各态的稳态概率。这可以通过求马氏链稳态概率的那个方程组来得到证明,实际上只需要对上面第一个方程两边同时对xi或者xj求和即可。再看一眼时间可逆马氏链的条件
πiPij=πjPji
两边同时对i求和,我们得到的是
iπiPij=πj
这正是马氏链的稳态方程(默认概率的归一性),而马氏链的稳态方程对应的是马氏链的细致平衡条件,所以这样时间可逆的马氏链一定满足马氏链的细致平衡条件,故时间可逆的马氏链一定存在稳态概率。

判断马氏链是否是时间可逆的充要条件

对于只要Pji=0就有Pij=0的遍历的马尔科夫链,它是时间可逆的当且仅当如果它开始在状态i,任意一个回到i的路径与它的反向路径有相同的概率,即如果对于一切状态i,i1,,ik, 有
Pi,i1Pi1,i2Pik,i=Pi,ikPik,ik1Pi1,i

这个充要条件告诉我们,可以通过考察马氏链从某个状态出发再回到这个状态的正向路径以及逆向路径的概率是否相等来判断这个马氏链是否是时间可逆的。

例题

假设给定了标号从1nn个元素的集合,将它们排列成某个有序的列表,在每个时间单位,有一个需求(独立于过去)即从这些元素中取出一个元素,元素i被需求的概率是Pi,元素经过需求后放回,但是不必放在原来的位置。现在有两种规则来决定元素经过需求后放置的新位置:

  1. 每次被需求的元素放在这个有序列表的表头位置
  2. 每次被需求的元素从其所在位置向列表的首位移进一个位置

我们关心的是在这个过程中采用上述两种规则中哪一种规则会使得长时间下被需求元素的平均位置最小(想象一下高中时期推挤在桌上的一摞书,被需求的元素就是我们要找到的书,我们一般是选择将找到书又放在最上面,虽然这样更省时,但这种方法一定就是最好的方法吗?)。

对于这n个元素的集合,其所有的n!个排列构成了所有的状态空间{Xn,n0}Xn=(e1n,e2n,,enn),容易得出这个状态空间中状态与状态之间的转移可以用马氏链来建模。实际上无论对于规则1还是规则2,整个过程中被需求元素的平均位置都为

E()=jnE(|ej)Pj

又因为元素ej被需求与否于它所在的位置无关,所以上式可以进一步写为

E()=jnE(ej)Pj

如何描述ej的位置?我们可以描述ej前面有多少个元素,然后这个数目再加1就是ej在序列中的位置。(一定要把不知如何描述的变量与其他变量结合起来,看看能否用其他变量予以描述)进而有如下定义

Ii={(1)1,eiej(2)0,else

那么1+iIi就表示ej的位置了,所以上述均值可以进一步写为

E()=jnE(1+iIi)Pj=1+jjiPjP(eiej)

这里看看那个有两个求和号的求和,它可以看做一个主对角为0的矩阵所有元素之和,所以可以拆成一个下三角和一个上三角的矩阵的和最后再求和,即上述式子可以化为

E()=1+i<jPjP(eiej)+i>jPjP(eiej)

再对那个下三角矩阵进行转置(交换了行和列(i,j要交换))后就换为了两个上三角矩阵的和最后再求和,即

E()=1+i<jPjP(eiej)+PiP(ejei)

进一步地,利用P(eiej)=1P(ejei),上式可以化为

E()=1+i<j(PiPj)P(ejei)+i<jPj

所以最终就只需要确定P(ejei)的位置了,而对于以上两种不同的规则,这个概率自然是不同的。首先来看规则1,因为规则1是移至队列首,所以这种情况下事件ejei等价于对于元素ei或者元素ej的需求是ej, 而对规则2就不是这样,因为可能ejei之间隔着多个元素,向前移动一个元素的情况下并不能保证谁在谁的前面。这样一来对于规则1,P(ejei)=ejej+ei.

现在要想说明规则2比规则1更优秀,我们就需要说明在Pi>Pj的情况下,PRule2(ejei)<PRule1(ejei)=ejej+ei或者在Pj>Pi的情况下,说明PRule2(ejei)>PRule1(ejei)=ejej+ei。因为这两种情况都使得E()在规则2下更小,我们这里只说明后面一种情况,前者是一样的推理。

现在考虑规则2,可以适用于规则2的马氏链是时间可逆的,比如说对于一个3状态的排列(1,2,3),根据上面充要条件的启发,我们考察它到它自身的任意一个路径的正向和逆向的概率:

(1,2,3)(2,1,3)(2,3,1)(3,2,1)(3,1,2)(1,3,2)(1,2,3)

正向路径的概率是 P2P3P3P1P1P2, 而反向路径的概率是 P2P1P1P3P3P2P2, 根据乘法的交换律可以知道对任何其他路径以及其他数目状态都有正向路径的概率等于反向路径的概率的结论,所以这个马氏链是时间可逆的马氏链。

根据时逆马氏链满足的式子 π(i)P(i,j)=π(j)P(j,i), 我们有

π(e1i,,eki,ek+1i,,eni)Pek+1i=π(e1i,,ek+1i,eki,,eni)Peki

现在根据要求ejei前面,我们考虑所有的eiej前面的所有状态(,ei,,ej,),根据上面这个等式有

π(,ei,,ej,)Pjk+1=π(,ej,,ei,)Pik+1 其中kejei之间相隔的元素个数

进而有

π(,ei,,ej,)=Pik+1Pjk+1π(,ej,,ei,)

因为Pj>Pi,所以进一步又有

π(,ei,,ej,)<PiPjπ(,ej,,ei,)

这个式子对所有的ei先于ej的式子都成立,对所有ei先于ej的情况求和,就得到下式

P(eiej)<PiPjP(ejei), 再通过P(eiej)=1P(ejei)就可以进一步得到

P(ejei)<PjPj+Pi

另一个方面的证明也可以同理得到,所以我们得出结论:对于被需求的元素来说,规则2比规则1具有更小的平均位置,这也说明如果我们在取书放书时采用规则2,被需求的书的位置就会更靠上。

posted @   SiranLee  阅读(1778)  评论(0编辑  收藏  举报
相关博文:
阅读排行:
· winform 绘制太阳,地球,月球 运作规律
· 震惊!C++程序真的从main开始吗?99%的程序员都答错了
· AI与.NET技术实操系列(五):向量存储与相似性搜索在 .NET 中的实现
· 超详细:普通电脑也行Windows部署deepseek R1训练数据并当服务器共享给他人
· 【硬核科普】Trae如何「偷看」你的代码?零基础破解AI编程运行原理
点击右上角即可分享
微信分享提示