DDPG算法
摘要:
关键词 离散动作与连续动作是相对的概念,一个是可数的,一个是不可数的。 在 CartPole 环境中,可以有向左推小车、向右推小车两个动作。在 Frozen Lake 环境中,小乌龟可以有上下左右四个动作。在 Atari 的 Pong 游戏中,游戏有 6 个按键的动作可以输出。 但在实际情况中,经常 阅读全文
posted @ 2020-11-08 19:17 my灬king 阅读(2763) 评论(0) 推荐(0) 编辑