随笔分类 -  NS3 GYM RL

摘要:如何选择深度强化学习算法?MuZero/SAC/PPO/TD3/DDPG/DQN/等(2021-04) https://zhuanlan.zhihu.com/p/342919579 深度强化学习调参技巧:以D3QN、TD3、PPO、SAC算法为例 https://zhuanlan.zhihu.com 阅读全文
posted @ 2022-08-31 11:47 atomxing 阅读(249) 评论(0) 推荐(0) 编辑
摘要:https://zhuanlan.zhihu.com/p/374376193 首发于机器学习与强化学习 写文章 强化学习一:基本原理 贺治东 数据挖掘、深度学习、NLP、强化学习 ​关注 1 人赞同了该文章 谈到强化学习,大家最直观的印象应该就是2016-2017年AlphaGo大胜世界围棋冠军李世 阅读全文
posted @ 2022-08-31 11:47 atomxing 阅读(47) 评论(0) 推荐(0) 编辑
摘要:https://www.bilibili.com/video/BV1ca41187qB?p=3 17分55秒 什么效果比较好 无论是奖励还是步数都是缓缓的上升 如果奖励不是一直向上升,例如是先上升再下降,那拿最高点的模型就好 阅读全文
posted @ 2022-08-31 11:23 atomxing 阅读(13) 评论(0) 推荐(0) 编辑
摘要:首先 我按照遗传算法纯python写好了强化学习算法 只要把这个移植到gym框架就好 主要看了这两个网址 https://blog.csdn.net/weixin_44597347/article/details/124301620 主要是这个!!! https://xueqiu.com/11649 阅读全文
posted @ 2022-08-31 11:22 atomxing 阅读(113) 评论(0) 推荐(0) 编辑

点击右上角即可分享
微信分享提示