摘要: Continuous Deep Q-Learning with Model-based Acceleration 本文提出了连续动作空间的深度强化学习算法。 开始正文之前,首先要弄清楚两个概念:Model-free 和 Model-based。引用 周志华老师的《机器学习》中的一段话来解释这个概念, 阅读全文
posted @ 2016-07-12 20:39 AHU-WangXiao 阅读(3576) 评论(0) 推荐(0) 编辑