会员
周边
众包
新闻
博问
闪存
赞助商
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
简洁模式
...
退出登录
注册
登录
luo-bai
为技术而发烧
博客园
首页
新随笔
联系
订阅
管理
2023年4月13日
使用Pytorch实现强化学习——DQN算法
摘要: 一、强化学习的主要构成 强化学习主要由两部分组成:智能体(agent)和环境(env)。在强化学习过程中,智能体与环境一直在交互。智能体在环境里面获取某个状态后,它会利用该状态输出一个动作(action)。然后这个动作会在环境之中被执行,环境会根据智能体采取的动作,输出下一个状态以及当前这个动作带来
阅读全文
posted @ 2023-04-13 23:00 Bai_Er
阅读(831)
评论(0)
推荐(0)
编辑
luo-bai自我介绍
摘要: 还没想好怎么介绍自己
阅读全文
posted @ 2023-04-13 22:16 Bai_Er
阅读(2)
评论(0)
推荐(0)
编辑
友情链接
摘要: 还没想好捏
阅读全文
posted @ 2023-04-13 22:16 Bai_Er
阅读(2)
评论(0)
推荐(0)
编辑
公告