摘要: 单臂摆是强化学习的一个经典模型,本文采用了4种不同的算法来解决这个问题,使用Pytorch实现。 以下是老版本,2022年9月14日新增Dueling DQN, Actor-Critic算法, SAC,更新了PPO,DDPG算法,在文末。 DQN: 参考: 算法思想: https://mofanpy 阅读全文
posted @ 2021-03-27 10:49 维和战艇机 阅读(6857) 评论(1) 推荐(2) 编辑