会员
周边
众包
新闻
博问
闪存
赞助商
所有博客
当前博客
我的博客
我的园子
账号设置
简洁模式
...
退出登录
注册
登录
Once in a life time 机器学习/Java
博客园
首页
新随笔
联系
订阅
管理
2020年4月24日
Q-learning算法介绍(1)
摘要: 我们在这里使用一个简单的例子来介绍Q-learning的工作原理。下图是一个房间的俯视图,我们的智能体agent要通过非监督式学习来了解这个陌生的环境。图中的0到4分别对应一个房间,5对应的是建筑物周围的环境。如果房间之间有一个门,那么这2个房间就是直接相通的,否则就要通过其他房间相通。 下面的这个
阅读全文
posted @ 2020-04-24 08:06 吕汉鸿
阅读(2719)
评论(0)
推荐(0)
编辑
公告