摘要: 我们在这里使用一个简单的例子来介绍Q-learning的工作原理。下图是一个房间的俯视图,我们的智能体agent要通过非监督式学习来了解这个陌生的环境。图中的0到4分别对应一个房间,5对应的是建筑物周围的环境。如果房间之间有一个门,那么这2个房间就是直接相通的,否则就要通过其他房间相通。 下面的这个 阅读全文
posted @ 2020-04-24 08:06 吕汉鸿 阅读(2719) 评论(0) 推荐(0) 编辑
Save on your hotel - hotelscombined.com