摘要: 目前流行的强化学习算法包括 Q-learning、SARSA、DDPG、A2C、PPO、DQN 和 TRPO。 这些算法已被用于在游戏、机器人和决策制定等各种应用中,并且这些流行的算法还在不断发展和改进,本文我们将对其做一个简单的介绍。 完整文章: https://avoid.overfit.cn/ 阅读全文
posted @ 2023-01-23 10:56 deephub 阅读(136) 评论(0) 推荐(0) 编辑