2022 年 2月随笔档案 - 凯鲁嘎吉

02 2022 档案

Deep Reinforcement Learning Hands-On——Policy Gradients – an Alternative

摘要：Deep Reinforcement Learning Hands-On——Policy Gradients – an Alternative 作者：凯鲁嘎吉 - 博客园 http://www.cnblogs.com/kailugaji/ 更多请看：Reinforcement Learning - 阅读全文

posted @ 2022-02-28 16:32 凯鲁嘎吉阅读(1935) 评论(0) 推荐(0) 编辑

动态规划(Dynamic Programming, DP)

摘要：动态规划(Dynamic Programming, DP) 作者：凯鲁嘎吉 - 博客园 http://www.cnblogs.com/kailugaji/ 动态规则是运筹学的一个分支, 它是解决多阶段决策过程最优化的一种数学方法。大约产生于20世纪50年代。1951年美国数学家贝尔曼(R .Bell 阅读全文

posted @ 2022-02-26 09:36 凯鲁嘎吉阅读(451) 评论(0) 推荐(0) 编辑

Deep Reinforcement Learning Hands-On——Higher-Level RL Libraries (PTAN)

摘要：Deep Reinforcement Learning Hands-On——Higher-Level RL Libraries (PTAN) 作者：凯鲁嘎吉 - 博客园 http://www.cnblogs.com/kailugaji/ 更多请看：Reinforcement Learning - 随阅读全文

posted @ 2022-02-23 12:01 凯鲁嘎吉阅读(417) 评论(0) 推荐(0) 编辑

Python小练习：argparse的用法

摘要：Python小练习：argparse的用法作者：凯鲁嘎吉 - 博客园 http://www.cnblogs.com/kailugaji/ 中文文档：argparse 命令行选项、参数和子命令解析器 1. test.py #!/usr/bin/env python3 # -*- coding=utf 阅读全文

posted @ 2022-02-19 15:08 凯鲁嘎吉阅读(139) 评论(0) 推荐(0) 编辑

Deep Reinforcement Learning Hands-On——Tabular Learning and the Bellman Equation

摘要：Deep Reinforcement Learning Hands-On——Tabular Learning and the Bellman Equation 作者：凯鲁嘎吉 - 博客园 http://www.cnblogs.com/kailugaji/ 更多请看：Reinforcement Lea 阅读全文

posted @ 2022-02-14 10:04 凯鲁嘎吉阅读(297) 评论(0) 推荐(0) 编辑

用Python绘制冬奥会吉祥物冰墩墩

摘要：用Python绘制冬奥会吉祥物冰墩墩作者：凯鲁嘎吉 - 博客园 http://www.cnblogs.com/kailugaji/ 想要保存Python中turtle模块的图片为jpg格式，前提需要在https://ghostscript.com/releases/gsdnld.html下载gs9 阅读全文

posted @ 2022-02-11 15:06 凯鲁嘎吉阅读(5897) 评论(0) 推荐(1) 编辑

随笔分类

随笔档案

搜索

常用链接

我的标签

积分与排名

随笔分类 (142)

随笔档案 (292)

文章档案 (2)

我在其他平台

阅读排行榜

评论排行榜

推荐排行榜

最新评论