上一页 1 ··· 20 21 22 23 24 25 26 27 28 ··· 61 下一页
摘要: 强化学习从基础到进阶-案例与实践[5.1]:Policy Gradient策略梯度-Cart pole游戏展示 阅读全文
posted @ 2023-06-30 15:53 汀、人工智能 阅读(88) 评论(0) 推荐(0)
摘要: 强化学习从基础到进阶-常见问题和面试必知必答[8]:近端策略优化(proximal policy optimization,PPO)算法 阅读全文
posted @ 2023-06-28 18:56 汀、人工智能 阅读(204) 评论(0) 推荐(0)
摘要: 强化学习从基础到进阶--案例与实践[7.1]:深度确定性策略梯度DDPG算法、双延迟深度确定性策略梯度TD3算法详解项目实战 阅读全文
posted @ 2023-06-27 23:20 汀、人工智能 阅读(178) 评论(0) 推荐(0)
摘要: 强化学习从基础到进阶-常见问题和面试必知必答[7]:深度确定性策略梯度DDPG算法、双延迟深度确定性策略梯度TD3算法详解 阅读全文
posted @ 2023-06-27 23:19 汀、人工智能 阅读(173) 评论(0) 推荐(0)
摘要: 强化学习从基础到进阶-常见问题和面试必知必答[6]:演员-评论员算法(advantage actor-critic,A2C),异步A2C、与生成对抗网络的联系等详解 阅读全文
posted @ 2023-06-26 22:56 汀、人工智能 阅读(263) 评论(0) 推荐(0)
摘要: 强化学习从基础到进阶-常见问题和面试必知必答[5]::梯度策略、添加基线(baseline)、优势函数、动作分配合适的分数(credit) 阅读全文
posted @ 2023-06-25 20:23 汀、人工智能 阅读(253) 评论(0) 推荐(0)
摘要: 强化学习从基础到进阶-案例与实践[4.1]:深度Q网络-DQN项目实战CartPole-v0 阅读全文
posted @ 2023-06-24 23:42 汀、人工智能 阅读(240) 评论(0) 推荐(0)
摘要: 强化学习从基础到进阶-常见问题和面试必知必答[4]::深度Q网络-DQN、double DQN、经验回放、rainbow、分布式DQN 阅读全文
posted @ 2023-06-24 23:41 汀、人工智能 阅读(329) 评论(0) 推荐(0)
摘要: 强化学习从基础到进阶-常见问题和面试必知必答[3]:表格型方法:Sarsa、Qlearning;蒙特卡洛策略、时序差分等以及Qlearning项目实战 阅读全文
posted @ 2023-06-23 15:33 汀、人工智能 阅读(109) 评论(0) 推荐(0)
摘要: 强化学习从基础到进阶-案例与实践[3]:表格型方法:Sarsa、Qlearning;蒙特卡洛策略、时序差分等以及Qlearning项目实战 阅读全文
posted @ 2023-06-23 15:30 汀、人工智能 阅读(539) 评论(0) 推荐(0)
上一页 1 ··· 20 21 22 23 24 25 26 27 28 ··· 61 下一页