2019 年 6月 2 日随笔档案 - JASONlee3

2019年6月2日

强化学习_Deep Q Learning(DQN)_代码解析

摘要： Deep Q Learning 使用gym的CartPole作为环境，使用QDN解决离散动作空间的问题。一、导入需要的包和定义超参数二、DQN构造函数 1、初始化经验重放buffer； 2、设置问题的状态空间维度，动作空间维度； 3、设置e-greedy的epsilon； 4、创建用于估计q值的阅读全文

posted @ 2019-06-02 21:47 JASONlee3 阅读(6045) 评论(1) 推荐(1) 编辑

Jason333

强化学习_Deep Q Learning(DQN)_代码解析

导航

公告