Actor-Critic-Methods | 强化学习

image

  • Policy Network(Actor) 策略网络用来控制agent的运动
  • Value Network(Critic) 价值网络用来评价运动的表现
posted @ 2023-04-12 04:38  kingchou007  阅读(11)  评论(0编辑  收藏  举报