摘要: 1、DQN算法介绍 DQN算与sarsa算法和Q-learning算法类似,对于sarsa和Q-learning,我们使用一个Q矩阵,记录所有的state(状态)和action(动作)的价值,不断学习更新,最后使得机器选择在某种状态下,价值最高的action进行行动。但是当state和action的 阅读全文
posted @ 2023-07-31 10:04 想成为编程高手的阿曼 阅读(195) 评论(0) 推荐(0) 编辑