2023 年 4月 13 日随笔档案 - Bai_Er

2023年4月13日

摘要：一、强化学习的主要构成强化学习主要由两部分组成：智能体（agent）和环境（env）。在强化学习过程中，智能体与环境一直在交互。智能体在环境里面获取某个状态后，它会利用该状态输出一个动作（action）。然后这个动作会在环境之中被执行，环境会根据智能体采取的动作，输出下一个状态以及当前这个动作带来阅读全文

posted @ 2023-04-13 23:00 Bai_Er 阅读(831) 评论(0) 推荐(0) 编辑

luo-bai自我介绍

摘要：还没想好怎么介绍自己阅读全文

posted @ 2023-04-13 22:16 Bai_Er 阅读(2) 评论(0) 推荐(0) 编辑

友情链接

摘要：还没想好捏阅读全文

posted @ 2023-04-13 22:16 Bai_Er 阅读(2) 评论(0) 推荐(0) 编辑

luo-bai

为技术而发烧

公告