2020 年 9月 26 日随笔档案 - 黎明程序员

摘要：目录强化学习中的关键概念游戏案例策略网络策略网络的训练源码实现效果演示参考资料本文不再维护，请移步最新博客： https://zhuanlan.zhihu.com/p/408239932 强化学习中的关键概念智能体（Agent）：也就是我们的机器人，它内部有一个策略网络，策略网络接阅读全文

posted @ 2020-09-26 16:52 黎明程序员阅读(905) 评论(0) 推荐(0) 编辑

黎明程序员