2019 年 9月 15 日随笔档案 - 人工智能遇见磐创

摘要：目录：1. 专栏知识结构从AlphaGo看深度强化学习 2. 强化学习问题马尔科夫决策过程最优价值函数和贝尔曼方程 3. 价值迭代策略迭代 4. 无模型的强化学习方法蒙特卡洛方法 ... 阅读全文

posted @ 2019-09-15 22:32 人工智能遇见磐创阅读(473) 评论(1) 推荐(0) 编辑

人工智能遇见磐创