摘要: 由于随机变量Z是离散的,所以是状态转移矩阵,如果变量是连续的,则是状态转移函数,比如马尔科夫决策过程中的状态转移函数P{s',r|s,a},也叫动态特性。 状态转移矩阵示例 表示zt变量有三个状态c1,c2,c3,分别转移到zt+1时刻的c1,c2,c3的概率。(数值待定) 阅读全文
posted @ 2020-07-25 08:35 Feynmania 阅读(1614) 评论(0) 推荐(0) 编辑