利用强化学习Q-Learning实现最短路径算法

如果你是一名计算机专业的学生，有对图论有基本的了解，那么你一定知道一些著名的最优路径解，如Dijkstra算法、Bellman-Ford算法和a*算法(A-Star)等。

这些算法都是大佬们经过无数小时的努力才发现的，但是现在已经是人工智能的时代，强化学习算法能够为我们提出和前辈一样好的解决方案吗?

本文中我们将尝试找出一种方法，在从目的地a移动到目的地B时尽可能减少遍历路径。我们使用自己的创建虚拟数据来提供演示，下面代码将创建虚拟的交通网格：

完整文章：

https://avoid.overfit.cn/post/a4d722175b984e39a8317a7fc44e8cd6

posted @ 2023-04-11 11:01 deephub 阅读(274) 评论(0) 收藏举报

刷新页面返回顶部