在马氏链的长程性质和其稳态概率那里我们讨论都是常返马氏链(不可约)在某个状态上停留的时间比例,这个时间比例也称为稳态概率,它等于这个不可约的常返马氏链从状态出发首次回到自身所需转移次数的期望的倒数。
这里我们主要考虑有限状态的马氏链在暂态类中某个状态上的停留时间。
从暂态到暂态的停留时间
设一个有限状态的马氏链的暂态类为, 且有在其上的暂态转移概率
现在我们考虑这个开始于的马氏链在状态上的平均停留时间()(从达到之后,之后再达到的过程就是到的过程了,这是对下面例子中的"最后"一词的预先解释),可以对初始转移取条件,那么可以得到下式
这个式子描述了取从的一步转移到,然后考虑从开始在上的平均停留时间,然后对求和。那么如果在开始时与相等呢?这意味着在刚刚开始时就已经以概率1在上停留了1个时间了,而上面这个式子却没有描述到这种情况,就算取,它描述的是从出发到自身的转移时间,并没有算上刚刚开始的这1个时间,但是如果在开始时的情况下,上述的求和式就是对的,所以综合考虑之下有
其中当且仅当,其他情况下为0. 接下来,对于第一步转移到的,如果它是个常返态,那么对于它即将到达的暂态来说,就可以无限次地被访问到,这就有悖于它为暂态的设定,所以这一步转移到的只能是个暂态,那么就有
即. 我们的目标是要求每一对的, 我们考虑矩阵
显而易见的是对角线上的元素都满足且考虑到的计算方式,矩阵可以写为
进一步解这个关于的方程,可以得到
这样知道矩阵的暂态的转移概率后就可以计算出,即初始状态在暂态的马氏链在暂态上停留的时间了。
现在我们考虑马氏链中的暂态的可达问题,即对于, 表示从出发经过步可达, 现在我们还不知道这个是有限的还是无限的。我们令, 接下来我们就要根据来求
到这里你可能会问,你这都达不到了,它怎么会对有贡献呢?实际上使得第二项不为0的唯一一种情况是,所以第二项化为
而对于第一项,它也会有的情况(也就是说达到或者达不到的情况下都会有的讨论);当时,达到的情况下在的停留时间的期望实际上等价于从出发并在上停留的时间期望,而这个期望时间为, 所以第一项可以化为
那么关于的方程就为
解得为
当正向接近于1时,说明从出发并在上停留的平均时间接近于1,这说明链从开始就基本上没有回到过, 此时 如果,就有,而 ,所以有 这符合前面的链从开始就基本上没有回到过上的判断。
一个例子--赌徒赌博问题
一个赌徒,他在每次赌博中依概率赢一个单位(筹码),并以概率输一个单位,假设各次赌博都是独立的,赌徒在开始有个单位,问他的财富在达到之前先达到的概率是多少?
虽然每次赌博是相互独立的,但是赌徒在每次开始赌博之前,它手中的筹码是上一局的筹码加1或者减1,所以可以使用马氏链来建模并分析整个过程。
首先用表示赌徒在第次赌博开始时手中的筹码, , 规定在赌徒的筹码达到或者时就不再进行赌博,那么表示的马氏链的转移概率为
可以小提一下的是这里也说明了赌徒每次赌博的结果只有两种,这和随机游走比较相似了。回到这里,我们感兴趣的是赌徒在初始有个筹码的情况下其筹码最后(这里$P_{NN} =1 NN$的概率,之所以这里不再强调他的财富在达到之前是因为已经规定了,也就是说它如果在过程中筹码如果达到了就会被困住(吸收掉),不会再参与到过程中来了,更不要提最后达到了。
用表示赌徒在初始有个筹码的情况下首次达到的概率,那么同样地,对首次转移取条件得到
那么可以得到关于它们的递推式
采取归纳的方式我们可以得到
进而可以得到
因为, 代入可解出, 那么最终为
例如,如果A与B赌博,A以0.6的概率获胜,若A以5个筹码开始,B以10个筹码开始,那么A在破产产让B输光的概率就是
需要注意的是赌徒问题中, 状态0和状态是常返态,而其他状态则是暂态,所以这个马氏链的状态类有三种,即, , . 现在考虑这样的问题,假设, 开始时有3个筹码,那么赌徒有5个筹码的平均时间是多少?那么马氏链的状态类有三种, , 说明我们研究的问题是一个从暂态到暂态的停留时间的问题,所以可以根据上面的步骤根据先写出状态转移矩阵,完事儿以后计算矩阵,最后的即为所求。
在这个问题的假设的基础上我们考察赌徒最终有1个筹码的概率,按照上面的的定义,我们可以比较轻松的计算出这个概率为
在这里停顿一下,这个问题也可以使用前面的那个的公式,前面的那个的公式描述的是初始有个筹码在破产前有个筹码的概率,也就是初始时有个筹码在筹码减少到0之前赢了个筹码,(这里减少到0之前其实表述的就是在达到常返态之前)。而要用这个公式,得把的表述换到的上下文中,表示初始时有3个筹码的情况下,在达到常返态之前有一个筹码的概率,而这里常返态有0,7,也就是说在初始时有3个筹码的情况下在增加4个筹码之前减少到1个筹码的概率(达到常返态7),而这由等价于初始时有2个筹码在达到6个筹码(这里6就是新的常返)之前达到0个筹码(破产)的概率,说它们是等价的是因为任何一条从到的路径都可以映射到从到的路径。所以我们这里构造了一条新的链,它的常返态分别是0,6;而之间的整数则是暂态,所以求就转化为求初始时有两个筹码在达到6个筹码前破产的概率,而这个事件则是事件 B:初始时有两个筹码在破产前达到6个筹码的概率 的补集,因为对达到6个筹码前破产取非表示希望达到6个筹码这个事件可以出现在破产这个事件前,即对应于B事件,所以根据的公式,我们有
一句话总结上面这种做法的思路就是将暂态到暂态的概率通过将其中一个暂态映射到新的链的常返态中,这样就可以回到最初的赌徒的赌博问题,且这里新的链的转移概率等于最初的赌徒赌博问题的转移概率。
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· DeepSeek 开源周回顾「GitHub 热点速览」
· 物流快递公司核心技术能力-地址解析分单基础技术分享
· .NET 10首个预览版发布:重大改进与新特性概览!
· AI与.NET技术实操系列(二):开始使用ML.NET
· 单线程的Redis速度为什么快?