强化学习_Deep Q Learning(DQN)_代码解析
摘要:
Deep Q Learning 使用gym的CartPole作为环境,使用QDN解决离散动作空间的问题。 一、导入需要的包和定义超参数 二、DQN构造函数 1、初始化经验重放buffer; 2、设置问题的状态空间维度,动作空间维度; 3、设置e-greedy的epsilon; 4、创建用于估计q值的 阅读全文
posted @ 2019-06-02 21:47 JASONlee3 阅读(6045) 评论(1) 推荐(1) 编辑