2021 年 3月 27 日随笔档案 - 维和战艇机

2021年3月27日

强化学习单臂摆(CartPole) （DQN， Reinforce，Actor-Critic, DDPG， PPO, SAC）Pytorch

摘要：单臂摆是强化学习的一个经典模型，本文采用了4种不同的算法来解决这个问题，使用Pytorch实现。以下是老版本，2022年9月14日新增Dueling DQN, Actor-Critic算法， SAC，更新了PPO，DDPG算法，在文末。 DQN：参考：算法思想： https://mofanpy 阅读全文

posted @ 2021-03-27 10:49 维和战艇机阅读(7482) 评论(1) 推荐(2) 编辑

维和战艇机

公告