随笔档案「2020年9月16日」：强化学习基本概念 ... - 赵代码

2020年9月16日

摘要：在强化学习中，有这样几个概念：智能体（Agent）:我们要操控的对象状态（State）:当前智能体在环境中所处状态行为（Action）:当前智能体在当前状态下要进行的下一个动作奖励（Reward）:当智能体进行某一个操作时，对其该操作给出的评价策略（Policy）:为达到目标（最大化奖励）阅读全文

posted @ 2020-09-16 09:47 赵代码阅读(429) 评论(0) 推荐(0)

赵代码

公告