[Algorithm] Graph

教学大纲


一、高教版《数据结构》

图的概念有点多,在此只讨论最基础的内容,所以选择比较薄的高教版《数据结构》。

1.4 非线性数据结构--图
1.4.1 图的基本概念
1.4.2 图形结构的物理存储方式
1.4.2.1 相邻矩阵
1.4.2.2 图的邻接表示
1.4.2.3 图的多重邻接表示
1.4.3 图形结构的遍历
1.4.4 无向连通图的最小生成树(minimum-cost spanning tree:MST)
1.4.5 有向图的最短路径
1.4.5.1 单源最短路径(single-source shortest paths)
1.4.5.2 每对顶点间最短路经(all-pairs shortest paths)
1.4.6 拓扑排序

 

二、网络资源

涉及到的内容:数据结构之图【还可以的大纲】

不错的教学视频:5 1 图的基本概念

 

 

 

三种表达

From: https://www.cs.usfca.edu/~galles/visualization/DFS.html

    • Logical Representation
    • Adjacency List Representation
    • Adjacency Matrix Representation

 

“普通”邻接表示

struct node{
  bool mark; //访问标志
  char letter; //顶点数据域
  struct edge *out; //指向边表的指针
};
struct edge{   bool mark; //访问标志   int no; //顶点编号   struct edge *link; //指向边表的后继 };

 

多重邻接表示

表节点存储的不是顶点的序号,而是指向边(或者说弧)另一端相邻顶点的指针。

struct node{
  bool mark; //访问标志
  char letter; //顶点数据域
  struct node *nextnode; //指向图顶点集合中下一个元素的指针
  struct arc *out; //指向该顶点边表的指针
};
struct arc{   bool mark; //访问标志   struct node *link; //指向该弧(边)的另一端顶点的指针   struct arc *nextarc; // 指向与该顶点连接的其余弧(边)的指针 };

 

看上去特别像倒排表:[IR] Inverted Index & Boolean retrieval

 

 

 

图的遍历 

一些概念

连通:如果从v到w存在一条(无向)路径,则称v和w是连通的

路径:v到w的路径是一系列的顶点的集合,其中任一对相邻的顶点间都有图中的边。路径的长度是路径中的边数(如果带权,则是所有边的权重和)。如果v和w之间的所有顶点都不同,则称简单路径(无回路)

回路:起点等于终点的路径

连通图:图中任意两顶点均连通

连通分量:无向图中的极大连通子图

强连通;有向图中顶点v和w之间存在双向路径(既有从v->w又有从w->v,可以不是同一条),则称v和w是强连通

弱连通:去掉方向后的v和w是连通的

强连通图:有向图中任意两顶点均强连通

强连通分量:有向图的极大强连通子图

 

遍历实现

不同的起点,会导致不同的遍历路径,也就生成了不同的“生成树”。

    • 深度优先(depth-first search:DFS)
    • 宽度优先(breadth-first search:BFS)

Depth First Search, DFS

 

Breadth First Search, BFS

广度优先搜索六层,就是“六度空间” 问题。

 

 

图的优化问题

"无向连通图" 的最小生成树(minimum-cost spanning tree:MST

既然从不同的顶点出发会有不同的生成树,而 n 个顶点的生成树有 n-1 条边,那么,当边带权的时候(网络),如何寻找一个(网络中)的最小生成树(即树中各边权值之和最小)?

以下内容具体参见:[Optimization] Greedy method

稠密图的贪心算法:Prim算法

从一个点一点一点向外扩张延伸,进入树内的点的dist都为0,往外延伸时是与树中任意一个结点距离最小

选择整个树周边的“最小的边”。

 

稀疏图的贪心算法:Kruskal算法

每次从剩余所有边中取最短的边,所选边不能构成回路

最小堆:查找最小的边

并查集:要连接的俩点不在同一棵树上。Goto: 超有爱的并查集

并查集的实现,int pre[1000]; 这个数组,记录了每个大侠的上级是谁。大侠们从1或者0开始编号(依据题意而定),pre[15]=3就表示15号大侠的上级是3号大侠。

如果一个人的上级就是他自己,那说明他就是掌门人了,查找到此为止。也有孤家寡人自成一派的,比如欧阳锋,那么他的上级就是他自己。每个人都只认自己的上级。比如胡青牛同学只知道自己的上级是杨左使。

张无忌是谁?不认识!要想知道自己的掌门是谁,只能一级级查上去。 

路径压缩,每个人通过指针在某一处查询自己门派的头儿。如果join有门派合并事件,则只修改门派的头儿即可。

 

 

有向图的最短路径

单源最短路径(single-source shortest paths)Dijkstra算法 (基于贪心算法)

Dijkstra算法和 最小生成树Prim算法最小生成树算法非常类似,大家可以先熟悉下个算法。两个算法都是基于贪心算法。

虽然Dijkstra算法相对来说比Bellman-Ford 算法更快,但是不适用于有负权值边的图,贪心算法决定了它的目光短浅。

而Bellman-Ford 算法从全局考虑,可以检测到有负权值的回路。

 

Ref: Dijkstra算法(一)之 C语言详解

核心思路

与S集合中相邻的点中找到最小的(“边”+相邻点的“值”),然后更新俩集合即可。

如果edge存在负数,则会破坏以上这句话背后的原则。

时间复杂度:O(E+V*logV)

 

基本思想

指定起点s (即从顶点s开始计算)。

S:记录已求出最短路径的顶点 (以及相应的最短路径长度);

U:记录还未求出最短路径的顶点 (以及该顶点到起点s的距离);

初始时,S中只有起点s;U中是除s之外的顶点,并且U中顶的路径是"起点s到该顶点的路径"。

然后,从U中找出路径最短的顶点,并将其加入到S中;

接着,更新U中的顶点和顶点对应的路径。

然后,再从U中找出路径最短的顶点,并将其加入到S中;

接着,更新U中的顶点和顶点对应的路径。 ... 重复该操作,直到遍历完所有顶点。


操作步骤

(1) 初始时,S只包含起点s;U包含除s外的其他顶点,且U中顶点的距离为"起点s到该顶点的距离"[例如,U中顶点v的距离为(s,v)的长度,然后s和v不相邻,则v的距离为∞]。

(2) 从U中选出"距离最短的顶点k",并将顶点k加入到S中;同时,从U中移除顶点k。

(3) 更新U中各个顶点到起点s的距离。之所以更新U中顶点的距离,是由于上一步中确定了k是求出最短路径的顶点,从而可以利用k来更新其它顶点的距离;例如,(s,v)的距离可能大于(s,k)+(k,v)的距离。

(4) 重复步骤(2)和(3),直到遍历完所有顶点。

 

每对顶点间最短路经(all-pairs shortest paths)Floyed算法 (基于动态规划)

Ref: Floyd 算法求多源最短路径

Floyd算法用来找出每对顶点之间的最短距离,它对图的要求是,

    • 既可以是无向图也可以是有向图,边权可以为负。
    • 但是不能存在负环 (可根据最小环的正负来判定)。

 

More details, please check : [Optimization] Dynamic programming

 

 

    /* 其他内容,再补充 */

 

End.

posted @ 2017-03-02 06:32  郝壹贰叁  阅读(338)  评论(0编辑  收藏  举报