摘要: 在RL中,需要对数据进行采样,因此如何构造可采样的数据或数据块,则是需要关注的问题: if self.actor_critic.is_recurrent: data_generator = rollouts.recurrent_generator( advantages, self.num_mini 阅读全文
posted @ 2022-08-27 10:22 呦呦南山 阅读(663) 评论(0) 推荐(0) 编辑