凯鲁嘎吉 - 博客园

2022年9月4日

Safe RL——Constrained Variational Policy Optimization for Safe Reinforcement Learning (CVPO)

摘要： Safe RL——Constrained Variational Policy Optimization for Safe Reinforcement Learning (CVPO) 作者：凯鲁嘎吉 - 博客园 http://www.cnblogs.com/kailugaji/ 强化学习可以看作为概阅读全文

posted @ 2022-09-04 10:44 凯鲁嘎吉阅读(1072) 评论(0) 推荐(0) 编辑

2022年8月9日

最优化——无约束最优化方法(Unconstrained Optimization Algorithms)

摘要：最优化——无约束最优化方法(Unconstrained Optimization Algorithms) 作者：凯鲁嘎吉 - 博客园 http://www.cnblogs.com/kailugaji/ 本篇介绍最优化方法(运筹学)里面的无约束优化方法，包括：线搜索法、信赖域法、以及最小二乘法。更多优阅读全文

posted @ 2022-08-09 20:51 凯鲁嘎吉阅读(1196) 评论(0) 推荐(2) 编辑

最优化——约束优化方法(Constrained Optimization Algorithms)

摘要：最优化——约束优化方法(Constrained Optimization Algorithms) 作者：凯鲁嘎吉 - 博客园 http://www.cnblogs.com/kailugaji/ 本篇介绍最优化方法(运筹学)里面的约束优化方法，包括：直接搜索法(随机方向法、约束坐标轮换法、复合形法、以阅读全文

posted @ 2022-08-09 20:17 凯鲁嘎吉阅读(3512) 评论(0) 推荐(1) 编辑

2022年4月20日

MATLAB聚类有效性评价指标（内部）

摘要： MATLAB聚类有效性评价指标（内部）作者：凯鲁嘎吉 - 博客园 http://www.cnblogs.com/kailugaji/ 外部评价指标(需要真实标签)，请看：MATLAB聚类有效性评价指标（外部），MATLAB聚类有效性评价指标（外部成对度量） MATLAB中有一个聚类内部评价指标的阅读全文

posted @ 2022-04-20 14:45 凯鲁嘎吉阅读(5293) 评论(0) 推荐(0) 编辑

2022年4月13日

《Easy RL》面试题汇总

摘要：《Easy RL》面试题汇总作者：凯鲁嘎吉 - 博客园 http://www.cnblogs.com/kailugaji/ 本博客汇总了蘑菇书《Easy RL》强化学习中文教程涉及的面试题及答案(v.1.0.3)。强化学习介绍可参看：强化学习(Reinforcement Learning) - 凯阅读全文

posted @ 2022-04-13 16:22 凯鲁嘎吉阅读(1490) 评论(0) 推荐(0) 编辑

2022年3月22日

离线强化学习(A Survey on Offline Reinforcement Learning)

摘要：离线强化学习(A Survey on Offline Reinforcement Learning) 作者：凯鲁嘎吉 - 博客园 http://www.cnblogs.com/kailugaji/ 通过阅读《A Survey on Offline Reinforcement Learning: Ta 阅读全文

posted @ 2022-03-22 17:18 凯鲁嘎吉阅读(3142) 评论(5) 推荐(3) 编辑

2022年3月5日

凯鲁嘎吉的主页

摘要：凯鲁嘎吉的主页凯鲁嘎吉的主页：kailugaji.github.io 或扫描下方二维码，即可查看阅读全文

posted @ 2022-03-05 11:21 凯鲁嘎吉阅读(1716) 评论(0) 推荐(0) 编辑

2022年2月28日

Deep Reinforcement Learning Hands-On——Policy Gradients – an Alternative

摘要： Deep Reinforcement Learning Hands-On——Policy Gradients – an Alternative 作者：凯鲁嘎吉 - 博客园 http://www.cnblogs.com/kailugaji/ 更多请看：Reinforcement Learning - 阅读全文

posted @ 2022-02-28 16:32 凯鲁嘎吉阅读(1872) 评论(0) 推荐(0) 编辑

2022年2月26日

动态规划(Dynamic Programming, DP)

摘要：动态规划(Dynamic Programming, DP) 作者：凯鲁嘎吉 - 博客园 http://www.cnblogs.com/kailugaji/ 动态规则是运筹学的一个分支, 它是解决多阶段决策过程最优化的一种数学方法。大约产生于20世纪50年代。1951年美国数学家贝尔曼(R .Bell 阅读全文

posted @ 2022-02-26 09:36 凯鲁嘎吉阅读(413) 评论(0) 推荐(0) 编辑

2022年2月23日

Deep Reinforcement Learning Hands-On——Higher-Level RL Libraries (PTAN)

摘要： Deep Reinforcement Learning Hands-On——Higher-Level RL Libraries (PTAN) 作者：凯鲁嘎吉 - 博客园 http://www.cnblogs.com/kailugaji/ 更多请看：Reinforcement Learning - 随阅读全文

posted @ 2022-02-23 12:01 凯鲁嘎吉阅读(404) 评论(0) 推荐(0) 编辑