posts - 292,comments - 409,views - 138万

当前标签：强化学习

Python小练习：object类型数据加载凯鲁嘎吉 2023-04-12 22:08 阅读:117 评论:0 推荐:0 编辑

Safe RL——Constrained Policy Optimization (CPO) 凯鲁嘎吉 2022-11-19 10:44 阅读:1626 评论:0 推荐:0 编辑

Safe RL——Constrained Variational Policy Optimization for Safe Reinforcement Learning (CVPO) 凯鲁嘎吉 2022-09-04 10:44 阅读:1129 评论:1 推荐:0 编辑

《Easy RL》面试题汇总凯鲁嘎吉 2022-04-13 16:22 阅读:1746 评论:0 推荐:0 编辑

离线强化学习(A Survey on Offline Reinforcement Learning) 凯鲁嘎吉 2022-03-22 17:18 阅读:3422 评论:5 推荐:3 编辑

Deep Reinforcement Learning Hands-On——Policy Gradients – an Alternative 凯鲁嘎吉 2022-02-28 16:32 阅读:1935 评论:0 推荐:0 编辑

动态规划(Dynamic Programming, DP) 凯鲁嘎吉 2022-02-26 09:36 阅读:451 评论:0 推荐:0 编辑

Deep Reinforcement Learning Hands-On——Higher-Level RL Libraries (PTAN) 凯鲁嘎吉 2022-02-23 12:01 阅读:417 评论:0 推荐:0 编辑

Deep Reinforcement Learning Hands-On——Tabular Learning and the Bellman Equation 凯鲁嘎吉 2022-02-14 10:04 阅读:297 评论:0 推荐:0 编辑

Hands-On Reinforcement Learning With Python——Temporal Difference Learning 凯鲁嘎吉 2022-01-10 09:58 阅读:284 评论:0 推荐:0 编辑

Windows下OpenAI gym环境的使用凯鲁嘎吉 2022-01-04 01:06 阅读:1548 评论:0 推荐:1 编辑

Meta-RL——Efficient Off-Policy Meta-Reinforcement Learning via Probabilistic Context Variables 凯鲁嘎吉 2021-11-23 13:04 阅读:1035 评论:5 推荐:0 编辑

RL——Deep Reinforcement Learning amidst Continual/Lifelong Structured Non-Stationarity 凯鲁嘎吉 2021-11-16 17:26 阅读:693 评论:0 推荐:0 编辑

Meta-RL——Decoupling Exploration and Exploitation for Meta-Reinforcement Learning without Sacrifices 凯鲁嘎吉 2021-11-10 15:22 阅读:315 评论:0 推荐:0 编辑

强化学习相关资料(书籍，课程，网址，笔记等) 凯鲁嘎吉 2021-11-01 16:14 阅读:2630 评论:0 推荐:1 编辑

双层优化问题：统一GAN，演员-评论员与元学习方法(Bilevel Optimization Problem unifies GAN, Actor-Critic, and Meta-Learning Methods) 凯鲁嘎吉 2021-10-21 13:15 阅读:5340 评论:2 推荐:1 编辑

重要性采样(Importance Sampling)——TRPO与PPO的补充凯鲁嘎吉 2021-10-13 11:32 阅读:2064 评论:0 推荐:2 编辑

近端策略优化算法(Proximal Policy Optimization Algorithms, PPO) 凯鲁嘎吉 2021-10-12 09:54 阅读:2728 评论:0 推荐:0 编辑

信赖域策略优化(Trust Region Policy Optimization, TRPO) 凯鲁嘎吉 2021-10-10 13:31 阅读:2648 评论:1 推荐:2 编辑

强化学习(Reinforcement Learning) 凯鲁嘎吉 2021-09-29 21:19 阅读:6350 评论:1 推荐:8 编辑

—.—宅出新高度—.—

联系我：2441040217@qq.com

Weibo：weibo.com/kailugaji

昵称：凯鲁嘎吉
园龄： 8年5个月
粉丝： 477
关注： 14

随笔分类 (142)

随笔档案 (292)

文章档案 (2)

我在其他平台

阅读排行榜

评论排行榜

推荐排行榜

最新评论

1. Re:Safe RL——Constrained Variational Policy Optimization for Safe Reinforcement Learning (CVPO)
为何结果看起来cvpo的效果一般
--weiweizhao
2. Re:交替方向乘子法（Alternating Direction Method of Multipliers）
@凯鲁嘎吉好嘞谢谢...
--ggrhhh
3. Re:交替方向乘子法（Alternating Direction Method of Multipliers）
@ggrhhh 能改变...
--凯鲁嘎吉
4. Re:交替方向乘子法（Alternating Direction Method of Multipliers）
涨知识了，想问问博主，迭代更新中x,z的更新顺序能改变吗，比如依次更新z、x、y
--ggrhhh
5. Re:深度聚类算法研究综述(A Survey of Deep Clustering Algorithms)
最新的一篇深度聚类综述：四川大学彭玺团队 - 2024.6《A Survey on Deep Clustering: From the Prior Perspective》...
--凯鲁嘎吉