2019 年 8月 29 日随笔档案 - 人工智能遇见磐创

摘要：目录：1. 引言专栏知识结构从AlphaGo看深度强化学习 2. 强化学习基础知识强化学习问题马尔科夫决策过程最优价值函数和贝尔曼方程 3. 有模型的强化学习方法价值迭代策略迭代 4... 阅读全文

posted @ 2019-08-29 21:01 人工智能遇见磐创阅读(1521) 评论(0) 推荐(0) 编辑

人工智能遇见磐创