Loading

摘要: 什么是强化学习(reinforcement learning) 假设一个场景,一个智能体(agent) 和环境(env)交互,智能体基于当前环境\(S_t\)每产生一个动作\(A_t\),环境便给它一个反馈,也被称为奖励(reward)\(R_{t+1}\), 随后,智能体的状态变为\(S_{t+1 阅读全文
posted @ 2023-10-07 20:42 lif323 阅读(11) 评论(0) 推荐(0) 编辑