摘要: 1. 马尔科夫性 无后效性,下一个状态只和当前状态有关而与之前的状态无关,公式描述:P[St+1|St]=P[St+1|S1,...,St]。强化学习中的状态也服从马尔科夫性,因此才能在当前状态下执行动作并转移到下一个状态,而不需要考虑之前的状态。 2. 马尔科夫过程 马尔科夫过程是随机过程的一种, 阅读全文
posted @ 2021-10-27 20:25 北极星! 阅读(506) 评论(0) 推荐(0) 编辑