会员
周边
众包
新闻
博问
闪存
赞助商
所有博客
当前博客
我的博客
我的园子
账号设置
简洁模式
...
退出登录
注册
登录
凯鲁嘎吉
用书写铭记日常,最迷人的不在远方
博客园
首页
新随笔
新文章
订阅
管理
上一页
1
2
3
4
5
6
7
···
30
下一页
2022年9月4日
Safe RL——Constrained Variational Policy Optimization for Safe Reinforcement Learning (CVPO)
摘要: Safe RL——Constrained Variational Policy Optimization for Safe Reinforcement Learning (CVPO) 作者:凯鲁嘎吉 - 博客园 http://www.cnblogs.com/kailugaji/ 强化学习可以看作为概
阅读全文
posted @ 2022-09-04 10:44 凯鲁嘎吉
阅读(1072)
评论(0)
推荐(0)
编辑
2022年8月9日
最优化——无约束最优化方法(Unconstrained Optimization Algorithms)
摘要: 最优化——无约束最优化方法(Unconstrained Optimization Algorithms) 作者:凯鲁嘎吉 - 博客园 http://www.cnblogs.com/kailugaji/ 本篇介绍最优化方法(运筹学)里面的无约束优化方法,包括:线搜索法、信赖域法、以及最小二乘法。更多优
阅读全文
posted @ 2022-08-09 20:51 凯鲁嘎吉
阅读(1196)
评论(0)
推荐(2)
编辑
最优化——约束优化方法(Constrained Optimization Algorithms)
摘要: 最优化——约束优化方法(Constrained Optimization Algorithms) 作者:凯鲁嘎吉 - 博客园 http://www.cnblogs.com/kailugaji/ 本篇介绍最优化方法(运筹学)里面的约束优化方法,包括:直接搜索法(随机方向法、约束坐标轮换法、复合形法、以
阅读全文
posted @ 2022-08-09 20:17 凯鲁嘎吉
阅读(3512)
评论(0)
推荐(1)
编辑
2022年4月20日
MATLAB聚类有效性评价指标(内部)
摘要: MATLAB聚类有效性评价指标(内部) 作者:凯鲁嘎吉 - 博客园 http://www.cnblogs.com/kailugaji/ 外部评价指标(需要真实标签),请看:MATLAB聚类有效性评价指标(外部),MATLAB聚类有效性评价指标(外部 成对度量) MATLAB中有一个聚类内部评价指标的
阅读全文
posted @ 2022-04-20 14:45 凯鲁嘎吉
阅读(5293)
评论(0)
推荐(0)
编辑
2022年4月13日
《Easy RL》面试题汇总
摘要: 《Easy RL》面试题汇总 作者:凯鲁嘎吉 - 博客园 http://www.cnblogs.com/kailugaji/ 本博客汇总了蘑菇书《Easy RL》强化学习中文教程涉及的面试题及答案(v.1.0.3)。强化学习介绍可参看:强化学习(Reinforcement Learning) - 凯
阅读全文
posted @ 2022-04-13 16:22 凯鲁嘎吉
阅读(1490)
评论(0)
推荐(0)
编辑
2022年3月22日
离线强化学习(A Survey on Offline Reinforcement Learning)
摘要: 离线强化学习(A Survey on Offline Reinforcement Learning) 作者:凯鲁嘎吉 - 博客园 http://www.cnblogs.com/kailugaji/ 通过阅读《A Survey on Offline Reinforcement Learning: Ta
阅读全文
posted @ 2022-03-22 17:18 凯鲁嘎吉
阅读(3142)
评论(5)
推荐(3)
编辑
2022年3月5日
凯鲁嘎吉的主页
摘要: 凯鲁嘎吉的主页 凯鲁嘎吉的主页:kailugaji.github.io 或扫描下方二维码,即可查看
阅读全文
posted @ 2022-03-05 11:21 凯鲁嘎吉
阅读(1716)
评论(0)
推荐(0)
编辑
2022年2月28日
Deep Reinforcement Learning Hands-On——Policy Gradients – an Alternative
摘要: Deep Reinforcement Learning Hands-On——Policy Gradients – an Alternative 作者:凯鲁嘎吉 - 博客园 http://www.cnblogs.com/kailugaji/ 更多请看:Reinforcement Learning -
阅读全文
posted @ 2022-02-28 16:32 凯鲁嘎吉
阅读(1872)
评论(0)
推荐(0)
编辑
2022年2月26日
动态规划(Dynamic Programming, DP)
摘要: 动态规划(Dynamic Programming, DP) 作者:凯鲁嘎吉 - 博客园 http://www.cnblogs.com/kailugaji/ 动态规则是运筹学的一个分支, 它是解决多阶段决策过程最优化的一种数学方法。大约产生于20世纪50年代。1951年美国数学家贝尔曼(R .Bell
阅读全文
posted @ 2022-02-26 09:36 凯鲁嘎吉
阅读(413)
评论(0)
推荐(0)
编辑
2022年2月23日
Deep Reinforcement Learning Hands-On——Higher-Level RL Libraries (PTAN)
摘要: Deep Reinforcement Learning Hands-On——Higher-Level RL Libraries (PTAN) 作者:凯鲁嘎吉 - 博客园 http://www.cnblogs.com/kailugaji/ 更多请看:Reinforcement Learning - 随
阅读全文
posted @ 2022-02-23 12:01 凯鲁嘎吉
阅读(404)
评论(0)
推荐(0)
编辑
上一页
1
2
3
4
5
6
7
···
30
下一页