摘要: 一、强化学习的主要构成 强化学习主要由两部分组成:智能体(agent)和环境(env)。在强化学习过程中,智能体与环境一直在交互。智能体在环境里面获取某个状态后,它会利用该状态输出一个动作(action)。然后这个动作会在环境之中被执行,环境会根据智能体采取的动作,输出下一个状态以及当前这个动作带来 阅读全文
posted @ 2023-04-13 23:00 Bai_Er 阅读(831) 评论(0) 推荐(0) 编辑
摘要: 还没想好怎么介绍自己 阅读全文
posted @ 2023-04-13 22:16 Bai_Er 阅读(2) 评论(0) 推荐(0) 编辑
摘要: 还没想好捏 阅读全文
posted @ 2023-04-13 22:16 Bai_Er 阅读(2) 评论(0) 推荐(0) 编辑