2017 年 4月 2 日随笔档案 - 宋小环

2017年4月2日

摘要： 1. 实验要求题目：计算最佳策略在下面例子基础上，自行设计一个问题（例如:求解某两点之间的最短路径，或是在图中加一些障碍物，计算最短路径），给出该问题对应的 MDP 模型描述，然后分别使用 value iteration 和 policy iteration 算法计算出最佳策略。 2．实验阅读全文

posted @ 2017-04-02 20:36 宋小环阅读(298) 评论(0) 推荐(0) 编辑

人工智能之计算最佳策略（Policy Iteration and Value Iteration)

posted @ 2017-04-02 20:36 宋小环阅读(3155) 评论(0) 推荐(0) 编辑

宋小环

公告