强化学习(8)------动态规划(通俗解释)
摘要:
一、动态规划 当问题具有下列两个性质时,通常可以考虑使用动态规划来求解: 一个复杂问题的最优解由数个小问题的最优解构成,可以通过寻找子问题的最优解来得到复杂问题的最优解 子问题在复杂问题内重复出现,使得子问题的解可以被存储起来重复利用 马尔科夫决策过程具有上述两个属性:贝尔曼方程把问题递归为求解子问 阅读全文
posted @ 2021-05-27 19:37 吱吱了了 阅读(887) 评论(0) 推荐(0) 编辑