摘要: 目录:1. 引言 专栏知识结构 从AlphaGo看深度强化学习 2. 强化学习基础知识 强化学习问题 马尔科夫决策过程 最优价值函数和贝尔曼方程 3. 有模型的强化学习方法 价值迭代 策略迭代 4... 阅读全文
posted @ 2019-08-29 21:01 人工智能遇见磐创 阅读(1521) 评论(0) 推荐(0) 编辑