Deep Reinforcement Learning Hands-On——Policy Gradients – an Alternative
摘要:Deep Reinforcement Learning Hands-On——Policy Gradients – an Alternative 作者:凯鲁嘎吉 - 博客园 http://www.cnblogs.com/kailugaji/ 更多请看:Reinforcement Learning -
阅读全文
posted @
2022-02-28 16:32
凯鲁嘎吉
阅读(1935)
推荐(0) 编辑
动态规划(Dynamic Programming, DP)
摘要:动态规划(Dynamic Programming, DP) 作者:凯鲁嘎吉 - 博客园 http://www.cnblogs.com/kailugaji/ 动态规则是运筹学的一个分支, 它是解决多阶段决策过程最优化的一种数学方法。大约产生于20世纪50年代。1951年美国数学家贝尔曼(R .Bell
阅读全文
posted @
2022-02-26 09:36
凯鲁嘎吉
阅读(451)
推荐(0) 编辑
Deep Reinforcement Learning Hands-On——Higher-Level RL Libraries (PTAN)
摘要:Deep Reinforcement Learning Hands-On——Higher-Level RL Libraries (PTAN) 作者:凯鲁嘎吉 - 博客园 http://www.cnblogs.com/kailugaji/ 更多请看:Reinforcement Learning - 随
阅读全文
posted @
2022-02-23 12:01
凯鲁嘎吉
阅读(417)
推荐(0) 编辑
Python小练习:argparse的用法
摘要:Python小练习:argparse的用法 作者:凯鲁嘎吉 - 博客园 http://www.cnblogs.com/kailugaji/ 中文文档:argparse 命令行选项、参数和子命令解析器 1. test.py #!/usr/bin/env python3 # -*- coding=utf
阅读全文
posted @
2022-02-19 15:08
凯鲁嘎吉
阅读(139)
推荐(0) 编辑
Deep Reinforcement Learning Hands-On——Tabular Learning and the Bellman Equation
摘要:Deep Reinforcement Learning Hands-On——Tabular Learning and the Bellman Equation 作者:凯鲁嘎吉 - 博客园 http://www.cnblogs.com/kailugaji/ 更多请看:Reinforcement Lea
阅读全文
posted @
2022-02-14 10:04
凯鲁嘎吉
阅读(297)
推荐(0) 编辑
用Python绘制冬奥会吉祥物冰墩墩
摘要:用Python绘制冬奥会吉祥物冰墩墩 作者:凯鲁嘎吉 - 博客园 http://www.cnblogs.com/kailugaji/ 想要保存Python中turtle模块的图片为jpg格式,前提需要在https://ghostscript.com/releases/gsdnld.html下载gs9
阅读全文
posted @
2022-02-11 15:06
凯鲁嘎吉
阅读(5897)
推荐(1) 编辑