由于随机变量Z是离散的,所以是状态转移矩阵,如果变量是连续的,则是状态转移函数,比如马尔科夫决策过程中的状态转移函数P{s',r|s,a},也叫动态特性。
状态转移矩阵示例
表示zt变量有三个状态c1,c2,c3,分别转移到zt+1时刻的c1,c2,c3的概率。(数值待定)