[Algorithm] Graph

教学大纲

一、高教版《数据结构》

图的概念有点多，在此只讨论最基础的内容，所以选择比较薄的高教版《数据结构》。

1.4 非线性数据结构--图
1.4.1 图的基本概念
1.4.2 图形结构的物理存储方式
1.4.2.1 相邻矩阵
1.4.2.2 图的邻接表示
1.4.2.3 图的多重邻接表示
1.4.3 图形结构的遍历
1.4.4 无向连通图的最小生成树（minimum-cost spanning tree:MST）
1.4.5 有向图的最短路径
1.4.5.1 单源最短路径（single-source shortest paths）
1.4.5.2 每对顶点间最短路经（all-pairs shortest paths）
1.4.6 拓扑排序

二、网络资源

涉及到的内容：数据结构之图【还可以的大纲】

不错的教学视频：5 1 图的基本概念

三种表达

From: https://www.cs.usfca.edu/~galles/visualization/DFS.html

- Logical Representation
- Adjacency List Representation
- Adjacency Matrix Representation

“普通”邻接表示

struct node{
　　bool mark; //访问标志
　　char letter; //顶点数据域
　　struct edge *out; //指向边表的指针
};

struct edge{
　　bool mark; //访问标志
　　int no; //顶点编号
　　struct edge *link; //指向边表的后继
};

多重邻接表示

表节点存储的不是顶点的序号，而是指向边（或者说弧）另一端相邻顶点的指针。

struct node{
　　bool mark; //访问标志
　　char letter; //顶点数据域
　　struct node *nextnode; //指向图顶点集合中下一个元素的指针
　　struct arc *out; //指向该顶点边表的指针
};

struct arc{
　　bool mark; //访问标志
　　struct node *link; //指向该弧（边）的另一端顶点的指针
　　struct arc *nextarc; // 指向与该顶点连接的其余弧（边）的指针
};

看上去特别像倒排表：[IR] Inverted Index & Boolean retrieval

图的遍历

一些概念

连通：如果从v到w存在一条（无向）路径，则称v和w是连通的

路径：v到w的路径是一系列的顶点的集合，其中任一对相邻的顶点间都有图中的边。路径的长度是路径中的边数（如果带权，则是所有边的权重和）。如果v和w之间的所有顶点都不同，则称简单路径（无回路）

回路：起点等于终点的路径

连通图：图中任意两顶点均连通

连通分量：无向图中的极大连通子图

强连通；有向图中顶点v和w之间存在双向路径（既有从v->w又有从w->v，可以不是同一条），则称v和w是强连通

弱连通：去掉方向后的v和w是连通的

强连通图：有向图中任意两顶点均强连通

强连通分量：有向图的极大强连通子图

遍历实现

不同的起点，会导致不同的遍历路径，也就生成了不同的“生成树”。

- 深度优先(depth-first search:DFS)
- 宽度优先(breadth-first search:BFS)

Depth First Search, DFS

Breadth First Search, BFS

广度优先搜索六层，就是“六度空间” 问题。

图的优化问题

"无向连通图" 的最小生成树（minimum-cost spanning tree:MST）

既然从不同的顶点出发会有不同的生成树，而 n 个顶点的生成树有 n-1 条边，那么，当边带权的时候（网络），如何寻找一个（网络中）的最小生成树（即树中各边权值之和最小）？

以下内容具体参见：[Optimization] Greedy method

稠密图的贪心算法：Prim算法

从一个点一点一点向外扩张延伸，进入树内的点的dist都为0，往外延伸时是与树中任意一个结点距离最小

选择整个树周边的“最小的边”。

稀疏图的贪心算法：Kruskal算法

每次从剩余所有边中取最短的边，所选边不能构成回路

最小堆：查找最小的边

并查集：要连接的俩点不在同一棵树上。Goto: 超有爱的并查集

并查集的实现，int pre[1000]; 这个数组，记录了每个大侠的上级是谁。大侠们从1或者0开始编号（依据题意而定），pre[15]=3就表示15号大侠的上级是3号大侠。

如果一个人的上级就是他自己，那说明他就是掌门人了，查找到此为止。也有孤家寡人自成一派的，比如欧阳锋，那么他的上级就是他自己。每个人都只认自己的上级。比如胡青牛同学只知道自己的上级是杨左使。

张无忌是谁？不认识！要想知道自己的掌门是谁，只能一级级查上去。

路径压缩，每个人通过指针在某一处查询自己门派的头儿。如果join有门派合并事件，则只修改门派的头儿即可。

有向图的最短路径

单源最短路径（single-source shortest paths）Dijkstra算法 (基于贪心算法)

Dijkstra算法和最小生成树Prim算法最小生成树算法非常类似，大家可以先熟悉下个算法。两个算法都是基于贪心算法。

虽然Dijkstra算法相对来说比Bellman-Ford 算法更快，但是不适用于有负权值边的图，贪心算法决定了它的目光短浅。

而Bellman-Ford 算法从全局考虑，可以检测到有负权值的回路。

Ref: Dijkstra算法(一)之 C语言详解

核心思路

与S集合中相邻的点中找到最小的(“边”＋相邻点的“值”)，然后更新俩集合即可。

如果edge存在负数，则会破坏以上这句话背后的原则。

时间复杂度：O(E+V*logV)

基本思想

指定起点s (即从顶点s开始计算)。

S：记录已求出最短路径的顶点 (以及相应的最短路径长度)；

U：记录还未求出最短路径的顶点 (以及该顶点到起点s的距离)；

初始时，S中只有起点s；U中是除s之外的顶点，并且U中顶的路径是"起点s到该顶点的路径"。

然后，从U中找出路径最短的顶点，并将其加入到S中；

接着，更新U中的顶点和顶点对应的路径。

然后，再从U中找出路径最短的顶点，并将其加入到S中；

接着，更新U中的顶点和顶点对应的路径。 ... 重复该操作，直到遍历完所有顶点。

操作步骤

(1) 初始时，S只包含起点s；U包含除s外的其他顶点，且U中顶点的距离为"起点s到该顶点的距离"[例如，U中顶点v的距离为(s,v)的长度，然后s和v不相邻，则v的距离为∞]。

(2) 从U中选出"距离最短的顶点k"，并将顶点k加入到S中；同时，从U中移除顶点k。

(3) 更新U中各个顶点到起点s的距离。之所以更新U中顶点的距离，是由于上一步中确定了k是求出最短路径的顶点，从而可以利用k来更新其它顶点的距离；例如，(s,v)的距离可能大于(s,k)+(k,v)的距离。

(4) 重复步骤(2)和(3)，直到遍历完所有顶点。

每对顶点间最短路经（all-pairs shortest paths）Floyed算法 (基于动态规划)

Ref: Floyd 算法求多源最短路径

Floyd算法用来找出每对顶点之间的最短距离，它对图的要求是，

- 既可以是无向图也可以是有向图，边权可以为负。
- 但是不能存在负环 (可根据最小环的正负来判定)。

More details, please check : [Optimization] Dynamic programming

　　　　/* 其他内容，再补充 */

End.

posted @ 2017-03-02 06:32 郝壹贰叁阅读(338) 评论(0) 编辑收藏举报

刷新页面返回顶部

机器学习水很深

We all have two lives. The second one starts when we realize that we only have one. --- Tom Hiddleston