随笔分类 - NS3 GYM RL
摘要:如何选择深度强化学习算法?MuZero/SAC/PPO/TD3/DDPG/DQN/等(2021-04) https://zhuanlan.zhihu.com/p/342919579 深度强化学习调参技巧:以D3QN、TD3、PPO、SAC算法为例 https://zhuanlan.zhihu.com
阅读全文
摘要:https://zhuanlan.zhihu.com/p/374376193 首发于机器学习与强化学习 写文章 强化学习一:基本原理 贺治东 数据挖掘、深度学习、NLP、强化学习 关注 1 人赞同了该文章 谈到强化学习,大家最直观的印象应该就是2016-2017年AlphaGo大胜世界围棋冠军李世
阅读全文
摘要:https://www.bilibili.com/video/BV1ca41187qB?p=3 17分55秒 什么效果比较好 无论是奖励还是步数都是缓缓的上升 如果奖励不是一直向上升,例如是先上升再下降,那拿最高点的模型就好
阅读全文
摘要:首先 我按照遗传算法纯python写好了强化学习算法 只要把这个移植到gym框架就好 主要看了这两个网址 https://blog.csdn.net/weixin_44597347/article/details/124301620 主要是这个!!! https://xueqiu.com/11649
阅读全文