《算法图解》——第七章 狄克斯特拉算法
第七章 狄克斯特拉算法
1 使用狄克斯特拉算法(Dijkstra’s algorithm)
用下图举个🌰:
该算法的四个步骤:
①找出"最便宜的节点",即可在最短时间内到达的节点,先找出
②更新该节点的邻居的开销
③重复这个过程,直到对图中的每个节点都这样做了
④计算最终路径
第一步:找出最便宜的节点,假设需要时间无穷大,节点B是最近的——2分钟。
第二步:计算经节点B前往其各个邻居所需要的时间。
找到一条前往节点A的更短路径。
对于节点B的邻居,如果找到前往它的更短路径,就更新其开销。在这里,你找到了:
前往节点A的更短路径(时间从6分钟缩短到5分钟);前往终点的更短路径(时间从无穷大缩短到7分钟)。
第三步:重复!
重复第一步:找出可在最短时间内前往的节点。你对节点B执行了第二步,除节点B外,可在最短时间内前往的节点是节点A。
重复第二步:更新节点A的所有邻居的开销。
你发现前往终点的时间为6分钟!
你对每个节点都运行了狄克斯特拉算法(无需对终点这样做)。现在,你知道:前往节点B需要2分钟;前往节点A需要5分钟;前往终点需要6分钟。
广度优先搜索来查找两点之间的最短路径,那时“最短路径”的意思是段数最少。在狄克斯特拉算法中,你给每段都分配了一个数字或权重,因此狄克斯特拉算法找出的是总权重最小的路径。
比较图:
2 术语
该算法用于每条边都有关联数字的图,这些数字称为权重(weight)
带权重的图为加权图(weighted graph),不带权重的图为非加权图(unweighted graph)
计算非加权图中的最短路径,可使用广度优先搜索。计算加权图中的最短路径,可使用狄克斯特拉算法。
可能会有环的存在:
绕环的路径不可能是最短的路径,在无向图中,每条边都是一个环。狄克斯特拉算法只适合于有向无环图(directed acyclic graph,DAG)
3 换钢琴
举个🌰:
首先,创建一个表(和之前一样无穷大):
第一步:找出最便宜的节点。换海报
第二步:计算前往该节点的各个邻居的开销。
再次执行第一步:下一个最便宜的节点是黑胶唱片——加5美元。你更新了架子鼓和吉他的开销!这意味着经“黑胶唱片”前往“架子鼓”和“吉他”的开销更低,因此你将这些乐器的父节点改为黑胶唱片。
再次执行第二步:更新黑胶唱片的各个邻居的开销。
下一个最便宜的是吉他,因此更新其邻居的开销。
你终于计算出了用吉他换钢琴的开销,于是你将其父节点设置为吉他。最后,对最后一个节点——架子鼓,做同样的处理。
我们知道了最短路径开销是35,如何确定路径呢?
先找出钢琴的父节点:架子鼓。架子鼓的父节点:黑胶唱片。黑胶唱片的父节点:乐谱。得到完整的路径。
最短路径指的并不一定是物理距离,也可能是让某种度量指标最小。
4 负权边
举个🌰:
第二种方式的开销少2美元,应采取这种方式。但是,如果有负权变,就不能使用狄克斯特拉算法。
因为该算法假设:
对于处理过的海报节点,没有前往该节点的更短路径。这种假设仅在没有负权边时才成立。因此,不能将狄克斯特拉算法用于包含负权边的图。在包含负权边的图中,要找出最短路径,可使用另一种算法——贝尔曼-福德算法(Bellman-Fordalgorithm)。
5 实现
以下图为🌰,用代码实现狄克斯特拉算法,
首先,需要三个散列表
第一个散列表是整个图的散列表,第二个散列表是开销,第三个散列表是父子节点
还需要一个数组,用于记录处理过的节点,因为对于同一个节点,你不用处理多次。processed = [ ]
算法如下:
代码如下:(书中有详细的每一步过程描述)
graph = {} #整个图的散列表 graph["start"] = {} graph["start"]["a"] = 6 graph["start"]["b"] = 2 graph["a"] = {} graph["a"]["fin"] = 1 graph["b"] = {} graph["b"]["a"] = 3 graph["b"]["fin"] = 5 graph["fin"] = {} infinity = float("inf") #散列表是开销 costs = {} costs["a"] = 6 costs["b"] = 2 costs["fin"] = infinity parents = {} #散列表是父子节点 parents["a"] = "start" parents["b"] = "start" parents["fin"] = None processed = [] def find_lowest_cost_node(costs): lowest_cost = float("inf") lowest_cost_node = None for node in costs: cost = costs[node] if cost < lowest_cost and node not in processed: lowest_cost = cost lowest_cost_node = node return lowest_cost_node node = find_lowest_cost_node(costs) #在未处理的节点中找出开销最小的节点 while node is not None: #在所有节点都被处理后结束 cost = costs[node] neighbors = graph[node] for n in neighbors.keys(): #遍历当前节点的所有邻居 new_cost = cost + neighbors[n] if costs[n] > new_cost: #如果经当前节点前往该邻居更近 costs[n] = new_cost #更新该邻居的开销 parents[n] = node #同时将该邻居的父节点设置为当前节点 processed.append(node) #将当前节点标记为处理过 node = find_lowest_cost_node(costs) #找出接下来要处理的节点,并循环 print(costs) print(parents)
练习
7.1 在下面的各个图中,从起点到终点的最短路径的总权重分别是多少?
A:8 B:60 C:负权边,无法用狄克斯特拉算法无法找出最短路径。
6 小结
广度优先搜索用于在非加权图中查找最短路径。
狄克斯特拉算法用于在加权图中查找最短路径。
仅当权重为正时狄克斯特拉算法才管用。
如果图中包含负权边,请使用贝尔曼-福德算法。