会员
周边
捐助
新闻
博问
闪存
赞助商
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
简洁模式
...
退出登录
注册
登录
呦呦南山
博客园
首页
新随笔
联系
订阅
管理
2022年8月27日
关于ppo中针对MLP和RNN两种不同网络结构的数据处理与采样方法
摘要: 在RL中,需要对数据进行采样,因此如何构造可采样的数据或数据块,则是需要关注的问题: if self.actor_critic.is_recurrent: data_generator = rollouts.recurrent_generator( advantages, self.num_mini
阅读全文
posted @ 2022-08-27 10:22 呦呦南山
阅读(663)
评论(0)
推荐(0)
编辑
公告