凯鲁嘎吉
用书写铭记日常,最迷人的不在远方

当前标签:强化学习

Python小练习:object类型数据加载 凯鲁嘎吉 2023-04-12 22:08 阅读:107 评论:0 推荐:0 编辑   
Safe RL——Constrained Policy Optimization (CPO) 凯鲁嘎吉 2022-11-19 10:44 阅读:1479 评论:0 推荐:0 编辑   
《Easy RL》面试题汇总 凯鲁嘎吉 2022-04-13 16:22 阅读:1482 评论:0 推荐:0 编辑   
离线强化学习(A Survey on Offline Reinforcement Learning) 凯鲁嘎吉 2022-03-22 17:18 阅读:3132 评论:5 推荐:3 编辑   
Deep Reinforcement Learning Hands-On——Policy Gradients – an Alternative 凯鲁嘎吉 2022-02-28 16:32 阅读:1871 评论:0 推荐:0 编辑   
动态规划(Dynamic Programming, DP) 凯鲁嘎吉 2022-02-26 09:36 阅读:413 评论:0 推荐:0 编辑   
Deep Reinforcement Learning Hands-On——Higher-Level RL Libraries (PTAN) 凯鲁嘎吉 2022-02-23 12:01 阅读:402 评论:0 推荐:0 编辑   
Deep Reinforcement Learning Hands-On——Tabular Learning and the Bellman Equation 凯鲁嘎吉 2022-02-14 10:04 阅读:290 评论:0 推荐:0 编辑   
Hands-On Reinforcement Learning With Python——Temporal Difference Learning 凯鲁嘎吉 2022-01-10 09:58 阅读:273 评论:0 推荐:0 编辑   
Windows下OpenAI gym环境的使用 凯鲁嘎吉 2022-01-04 01:06 阅读:1463 评论:0 推荐:1 编辑   
强化学习相关资料(书籍,课程,网址,笔记等) 凯鲁嘎吉 2021-11-01 16:14 阅读:2440 评论:0 推荐:1 编辑   
重要性采样(Importance Sampling)——TRPO与PPO的补充 凯鲁嘎吉 2021-10-13 11:32 阅读:1820 评论:0 推荐:2 编辑   
近端策略优化算法(Proximal Policy Optimization Algorithms, PPO) 凯鲁嘎吉 2021-10-12 09:54 阅读:2562 评论:0 推荐:0 编辑   
信赖域策略优化(Trust Region Policy Optimization, TRPO) 凯鲁嘎吉 2021-10-10 13:31 阅读:2339 评论:1 推荐:2 编辑   
强化学习(Reinforcement Learning) 凯鲁嘎吉 2021-09-29 21:19 阅读:5991 评论:1 推荐:8 编辑