摘要: 目录: 马尔科夫过程 马尔科夫奖励过程 马尔科夫决策过程 MDPs的拓展 1.马尔科夫过程 Markov decision processes formally describe an environment for reinforcement learning, where the environ 阅读全文
posted @ 2021-01-30 22:23 常给自己加个油 阅读(312) 评论(0) 推荐(0) 编辑