2019年2月19日

Udacity DRL DQN

摘要: A. DQN文章细节要点Pre-processing: 将原始输入转化为正方形照片,这样可以使用gpu加速训练。Frames Stacking : 将连续的四帧图片打包成一个输入,即84 * 84 * 4,因此DQN也可以capture time correlation.Frame-Skipping Technique:训练时,每4帧选择一次动作Experience Replay:data eff... 阅读全文

posted @ 2019-02-19 09:40 bourne_lin 阅读(480) 评论(0) 推荐(0) 编辑

导航