摘要: 1.算法仿真效果 matlab2022a仿真结果如下: 2.算法涉及理论知识概要 Q-Learning是一种无模型的强化学习算法,它能够使代理(Agent)在与环境互动的过程中学习最优策略,无需了解环境的完整动态模型。在迷宫路线规划问题中,Q-Learning被用来指导代理找到从起点到终点的最优路径 阅读全文
posted @ 2024-05-07 22:01 我爱C编程 阅读(13) 评论(0) 推荐(0) 编辑