摘要: 目录:1. 专栏知识结构 从AlphaGo看深度强化学习 2. 强化学习问题 马尔科夫决策过程 最优价值函数和贝尔曼方程 3. 价值迭代 策略迭代 4. 无模型的强化学习方法 蒙特卡洛方法 ... 阅读全文
posted @ 2019-09-15 22:32 人工智能遇见磐创 阅读(473) 评论(1) 推荐(0) 编辑