随笔分类 -  OpenAI

摘要:一、强化学习问题需要描述那些内容 强化学习中最主要的两类对象是“个体”和“环境”,其次还有一些像“即时奖励”、“收获”、“状态”、“行为”、“价值”、“策略”、“学习”、“控制”等概念。这些概念把个体和环境联系起来。通过理论学习,我们知道: 1. 环境响应个体的行为。当个体执行一个行为时,它需要根据 阅读全文
posted @ 2018-01-16 09:42 彼岸花杀是条狗 阅读(5998) 评论(0) 推荐(0) 编辑
摘要:介绍 OpenAI Gym是一款用于研发和比较强化学习算法的工具包,它支持训练智能体(agent)做任何事——从行走到玩Pong或围棋之类的游戏都在范围中。 OpenAI Gym 是一个用于开发和比较RL 算法的工具包,与其他的数值计算库兼容,如tensorflow 或者theano 库。现在主要支 阅读全文
posted @ 2018-01-02 23:46 彼岸花杀是条狗 阅读(23712) 评论(0) 推荐(2) 编辑

点击右上角即可分享
微信分享提示