2019年2月18日

Udacity DRL DQN project

摘要: 使用namedtuple创建 (s, a, s', r)的存储,可以根据名称作为索引。(命名元组赋予每个位置一个含义,提供可读性和自文档性。它们可以用于任何普通元组,并添加了通过名字获取值的能力,通过索引值也是可以的。)然后在使用batch_SGD训练的时候,可以依次按照名称进行打包,返回batch。(当然在这里用索引也是可以的,但代码可读性稍差)创建replay buffer用deque线程... 阅读全文

posted @ 2019-02-18 16:37 bourne_lin 阅读(162) 评论(0) 推荐(0) 编辑

导航