摘要: Exploration and Exploitation(探索和利用)是强化学习需要去平衡的一个点,即我应该去探索新的选项还是充... 阅读全文
posted @ 2019-08-30 11:41 从流域到海域 阅读(160) 评论(0) 推荐(0) 编辑
摘要: RL Algorithm Components 通常包括一个或者更多: Model(模型): world对agent的动作如何改变的... 阅读全文
posted @ 2019-08-30 10:17 从流域到海域 阅读(65) 评论(0) 推荐(0) 编辑