强化学习总结

强化学习是学习一个最优策略(policy),可以让本体(agent)在特定环境(environment)中,根据当前的状态(state),做出行动(action),从而获得最大回报(G or Return)。

posted on 2018-07-20 10:36  夜尽天明00  阅读(109)  评论(0编辑  收藏  举报