提高篇－－图算法专题４

图的定义和相关术语

图由顶点，边组成
有向图
无向图，所有边是双向的
顶点的度是指和该顶点相连的边的条数
对有向图，顶点的出边条数为该顶点的出度，顶点的入边条数称为该顶点的入度

图的存储

邻接矩阵和邻接表

邻接矩阵

设图G(V,E)的顶点标号为0，１，...，N-1
则可令二维数组G[N][N]的量两维分别表示图的顶点标号，
即如G[i][j]为１，表示顶点i和顶点ｊ间有边，如为０，则说明顶点ｉ和顶点ｊ间不存在边
此二维数组G[][]称为邻接矩阵
邻接矩阵在顶点个数较多时，会需要较大内存

邻接表

设图G(V, E)的顶点编号为0,1,...,N-1
每个顶点可能有若干条出边，
如把同一个顶点的所有出边放在一个列表中
则Ｎ个顶点有Ｎ个列表
这Ｎ个列表称为图Ｇ的邻接表，即为Adj[N]
Adj[i]存放顶点ｉ的所有出边组成的列表

图的遍历

指对图的所有顶点按一定顺序进行访问
访问方法一般有：深度有限搜索［ＤＦＳ］，广度优先搜索［ＢＦＳ］

用深度有限搜索遍历图

- 用DFS遍历图
- DFS具体实现
１．连通分量
无向图中，如两个顶点间可相互到达，称为两个顶点连通
如G(V,E)的任意两个顶点都连通，称为图Ｇ为连通图
否则，称图Ｇ为非连通图，且其中极大连通子图的连通分量
２．强连通分量
有向图中，如两个顶点可各自通过一条有向路径到达另一个顶点
称者两个顶点强连通
如G(V,E)的任意两个顶点都强连通，称图Ｇ为强连通图
否则，称图Ｇ为非强连通图，且其中的极大强连通子图为强连通分量

把连通分量和强连通分量均称为连通块

采用广度优先搜索法遍历图

- 用BFS遍历图
广度优先搜索以"广度"为关键词
- BFS的具体实现

最短路径

给定G(V,E)
求一条从起点到终点的路径
使路径上经过的所有边的边权之和最小

对任意给出的图G(V,E)
和起点Ｓ，终点Ｔ
求从Ｓ到Ｔ的最短路径
解决最短路径问题的常用算法有Dijkstra算法，Bellman-Ford,SPFA,Floyd

Dijkstra

来解决单源最短路径
即给定图Ｇ和起点ｓ
通过算法得到Ｓ到达其他每个顶点的最短距离

基本思想
对图G(V,E)
设置集合Ｓ，存放已被访问的顶点
每次从集合Ｖ－Ｓ中选择与起点Ｓ的最短距离最小的一个顶点［记为ｕ］
访问并加入集合Ｓ
令ｕ为中介点
优化起点ｓ与所有从ｕ能到达的顶点ｖ间的最短距离
执行ｎ次［ｎ为顶点个数］
直到集合Ｓ已包含所有顶点

Dijkstra算法解决的是单源最短路问题，
即给定图G(V,E)和起点ｓ
求起点ｓ到达其它顶点的最短距离

策略：
设集合Ｓ存放已被访问的顶点
执行ｎ次下面步骤
- 每次从集合V-S中选择与起点s的最短距离最小的一个顶点ｕ，访问并加入集合Ｓ
- 令ｕ为中介点，检查ｕ直接可达节点是否可优化，若可优化，优化

对有两条及以上可达最短距离的路径，
考察时，常给出第二标尺
第二标尺常见的是以下三种出题方法或其组合
- 给每条边增加一个边权［如发费］
要求在最短路径多条时，要求路径上发费之和最小
- 给每个点一个点权，在最短路径有多条时，要求路径上的点权之和最大
- 直接问有多少条最短路径

Bellman-Ford算法和SPFA算法

Dijkstra适合权重非负图
Bellman-Ford适合权重非负和负两种情况

根据环中边权之和的正负，环分为零环，正环，负环
从源点可达节点集合存在负环时，导致最短路径不存在

执行V-1轮循环
每轮遍历图中所有边
对每条边u-->v
如以ｕ为中介点可使d[v]更小
则更新到ｖ的路径
算法时间复杂度O(VE)

此后，
再对所有边进行一轮操作
判断是否存在可优化路径，如有，说明存在负环，返回false
否则，结束

注意到，只有当某个顶点ｕ的d[u]值改变时，
从它出发的边的邻接点ｖ的d[v]值才可能被改变
进行一个优化
建立一个队列
每次将队首顶点ｕ取出
对从ｕ出发的所有边ｕ-->v进行松弛操作
如可松弛，更新路径，如被更新的顶点ｖ不在队列中，
把ｖ加入队列
直到队列为空［说明图中没有从源点可达的负环］
或某顶点入队次数超过了V-1［说明图中存在从源点可达的负环］
queue Q;
源点ｓ入队
while(队列非空)
{
取出队首元素ｕ
for(u的所有邻接边u->v)
{
if(d[u]+dis<d[v])
{
d[v]=d[u]+dis;
if(v当前不在队列)
{
ｖ入队
if(v入队次数大于n-1)
{
说明有可达负环，ｒｅｔｕｒｎ
}
}
}
}
}

优化后的算法称为SPFA
期望时间复杂度为O(kE)
k是一个常数

Floyd算法

解决全源最短路径
对给定的图G(V,E)
求任意两点u,v之间的最短路径长度
时间复杂度是O(n^3)

算法基于这样一个事实：
如存在顶点ｋ
使得以ｋ作为中介时顶点ｉ和顶点ｊ的当前最短距离缩短
则使用顶点ｋ作为顶点ｉ和顶点ｊ的中介点
即当dis[i][k]+dis[k][j]<dis[i][j]时，
令dis[i][j]=dis[i][k]+dis[k][j]

算法流程
枚举顶点ｋ属于[1,n]
以顶点ｋ作为中介点，枚举所有顶点对ｉ和ｊ（ｉ属于[1,n], j属于[1,n]）
如果dis[i][k]+dis[k][j]<dis[i][j]成立
赋值dis[i][j]=dis[i][k]+dis[k][j]

最小生成树

最小生成树及其性质

最小生成树是在一个给定的无向图G(V,E)中求一棵树Ｔ
使得这棵树拥有图Ｇ中的所有顶点
且所有边都是来自图Ｇ中的边
且满足整棵树的边权之和最小

最小生成树３个性质：
- 最小生成树是树，其边数等于顶点数减１，且树内一定不会有环
- 对给定的图G(V,E)，其最小生成树可不唯一，但边权之和一定是唯一的
- 由于最小生成树是在无向图上生成的，其根结点可是这棵树上的任意一个节点

求解最小生成树有prim算法与kruskal算法

prim算法

基本思想
对图G(V,E)设置集合Ｓ
存放已被访问的顶点
每次从集合V-S中选择与集合Ｓ的最短距离最小的一个顶点［即为ｕ］访问并加入集合Ｓ
令顶点ｕ为中介点
优化所有从ｕ能到达的顶点ｖ与集合Ｓ之间的最短距离

执行ｎ次
直到Ｓ已包含所有顶点

prim算法解决的是最小生成树问题
即在一个给定的无向图G(V,E)中求一棵生成树
使得这棵树拥有图Ｇ中的所有顶点
且所有边都是来自图G中的边
且满足整棵树的边权之和最小

prim算法的具体实现
集合Ｓ的实现
顶点V_{i}［0<=i<=n-1］与集合Ｓ的最短距离
- 集合Ｓ的实现方法和Dijkstra中相同

// G为图，一般设为全局变量
// 数组ｄ为顶点与集合Ｓ的最短距离
prim(G, d[])
{
初始化
for(循环ｎ次)
{
u =　使d[u]最小的还未被访问的顶点的标号
记ｕ已被访问
for(从ｕ出发能到达的所有顶点ｖ)
{
if(v未被访问&&以ｕ为中介点使得ｖ与集合Ｓ的最短距离d[v]更优)
{
将G[u][v]赋值给ｖ与集合Ｓ的最短距离d[v]
}
}
}
}

算法时间复杂度O(V^2)

kruskal算法

kruskal算法采用了边贪心的策略
基本思想
在初始状态时隐去图中的所有边
图中每个顶点都自成一个连通块
之后执行下面步骤
- 对所有边按边权从小到大进行排序
- 按边权从小到大测试所有边
如当前测试边所连接的两个顶点不在同一个连通块中，
则把这条测试边加入当前最小生成树中，否则，将边舍弃
- 执行步骤２，直到最小生成树中的边数等于总顶点数减１或是测试完所有边时结束
结束时，如最小生成树的边数小于总顶点数减１
说明该图不连通

需要判断边的两个端点是否在不同的连通块中
struct edge
{
int u, v;
int cost;
} E[MAXE];

bool cmp(edge a, edge b)
{
return a.cost < b.cost;
}

int kruskal()
{
令最小生成树的边权之和为ans，最小生成树的当前边数Num_Edge
将所有边按边权从小到大排序
for(从小到大枚举所有边)
{
if(当前测试边的两个端点在不同的连通块中)
{
将该测试边加入最小生成树中
ans += 测试边的边权
最小生成树的当前边数Num_Edge加１
当边数Num_Edge等于顶点数减１时结束循环
}
}

return ans;
}

如何判断测试边的两个端点是否在不同的连通块中
如何将测试边加入最小生成树中

如把每个连通块当作一个集合
就可把问题转换为判断两个端点是否在同一个集合中，可用并查集

并查集可通过查询两个节点所在集合根节点是否相同来判断它们是否在同一个结合
只要把测试边的两个端点所在集合合并，就能达到将边加入最小生成树的效果
int father[N];
int findFather(int x)
{
...
}

int kruskal(int n, int m)
{
int ans = 0, Num_Edge = 0;
for(int i = 1; i <= n; i++)
{
father[i] = i;
}

sort(E, E+m, cmp);
for(int i = 0; i < m; i++)
{
int faU = findFather(E[i].u);
int faV = findFather(E[i].v);
if(faU != faV)
{
father[faU] = faV;
ans += E[i].cost;
Num_Edge++;
if(Num_Edge == n - 1)
{
break;
}
}
}

if(Num_Edge != n - 1)
{
return -1;
}
else
{
return ans;
}
}

时间复杂度为O(Elog(E))
适合顶点多，边少情况

边多时，一般用Prim
边少时，一般用kruskal

拓扑排序

有向无环图

如一个有向图的任意顶点无法通过一些有向边回到自身
则称这个有向图为有向无环图

拓扑排序

拓扑排序是将有向无环图Ｇ的所有顶点排成一个线性序列
使得对Ｇ的任意两个顶点u, v
如存在边u->v
则在序列中ｕ一定在ｖ前面
这个序列又称为拓扑序列
- １．定义一个队列Ｑ，把所有入度为０的结点加入队列
- ２．取队首结点，输出
删去所有从它出发的边
令这些边到达的顶点的入度减１
如顶点的入度减为０，则将其加入队列
- 反复进行２操作，直到队列为空
如队列为空时，入过队的节点数目恰好为Ｎ
说明拓扑排序成功
否则，拓扑排序失败

vector G[MAXV];
int n, m, inDegree[MAXV];
bool topologicalSort()
{
int num = 0;
queue q;
for(int i = 0; i < n; i++)
{
if(inDegree[i] == 0)
{
q.push(i);
}
}

while(!q.empty())
{
int u = q.front();
q.pop();
for(int i = 0; i < G[u].size(); i++)
{
int v = G[u][i];
inDegree[v]--;
if(inDegree[v] == 0)
{
q.push(v);
}
}

G[u].clear();
num++;
}

if(num == n)
{
return true;
}
else
{
return false;
}
}

可用来判断是否有环

关键路径

ＡＯＶ网和ＡＯＥ网

ＡＯＶ网
指用顶点表示活动
用边集表示活动间优先关系的有向图

ＡＯＥ网
边活动网是指用带权的边集表示活动
用顶点表示事件的有向图

ＡＯＥ网重点解决两个问题：
- 工程起始到终止需要多少时间
- 哪条路径上的活动是影响整个工程进度的关键
ＡＯＥ网中的最常路径被称为关键路径
关键路径上的活动称为关键活动

最长路径

对一个没有正环的图［指从源点可达的正环］
如需求最长路径长度
可把所有边边权乘以－１
令其变为相反数
然后用Bellman-Ford算法或SPFA求最短路径长度，将所得结果取反即可

如图中有正环，则最长路径不存在

关键路径

ＡＯＥ网实际是有向无环图
关键路径是图中的最长路径
求解有向无环图中最长路径的方法
设置数组ｅ和ｌ，其中e[r]和l[r]
分别表示活动a_{r}的最早开始时间和最迟开始时间
求出上述两个数组后，
可通过判断e[r]==l[r]是否成立来确立活动ｒ是否是关键活动

怎样求解数组e和l
事件V_{i}在经过活动a_{r}之后到达事件V_{j}
注意，顶点作为事件，也有拖延可能
ve[i] 事件ｉ的最早发生时间
vl[i] 事件ｉ的最迟发生时间
- 对活动a_{r}来说，只要在事件V_{i}最早发生时马上开始，就可使得活动a_{r}的开始时间最早，故e[r]=ve[i]
- 如l[r]是活动a_{r}最迟发生时间，则l[r]+length[r]就是事件V_{j}的最迟发生时间，故l[r]=vl[j]-length[r]

只要求出ve和vl两个数组，就可通过上面公式得到ｅ和ｌ这两个数组
如有ｋ个事件V_{i1}_{V_{ik}通过相应的活动a_{r1}}a_{rk}到达事件V_{j}
活动的边权为length[rl]~length[rk]
设已算好了事件V_{i1}_{V_{ik}的最早发生时间ve[i1]}ve[ik]
则事件V_{j}的最早发生时间就是ve[i1]+length[r1]~ve[ik]+length[rk]中的最大值
此处取最大值是因为只有所有能到达V_{j}的活动都完成后，V_{j}才能被"激活"

需要保证访问某节点时，它的前驱结点都已经访问完毕
使用拓扑排序可完成

按拓扑序列计算ve数组时，可保证计算到某个节点时，该节点所有前驱都已经计算完成

在拓扑排序访问到某个节点时，使用ve[i]去更新其所有后继结点的ve值
// 拓扑序列
stack topOrder;
bool topologicalSort()
{
queue q;
for(int i = 0; i < n; i++)
{
if(inDegree[i] == 0)
{
q.push(i);
}
}

while(!q.empty())
{
int u = q.front();
q.pop();
topOrder.push(u);
for(int i = 0; i < G[u].size(); i++)
{
int v = G[u][i].v;
inDegree[v]--;
if(inDegree[v] == 0)
{
q.push(v);
}

// 用ve[u]来更新u的所有后续结点ｖ
if(ve[u] + G[u][i].w > ve[v])
{
ve[v] = ve[u] + G[u][i].w;
}
}
}

if(topOrder.size() == n)
{
return true;
}
else
{
return false;
}
}

同理，从事件V_{i}出发通过相应的活动a_{r1}_{a_{rk}可到达的ｋ个事件V_{j1}}V_{jk}
活动的边权为length[rl]~length[rk]
假设已经算好了事件V_{j1}_{V_{jk}的最迟发生时间vl[j1]}vl[jk]
则事件V_{i}的最迟发生时间就是vl[j1]-length[rl]~vl[jk]-length[rk]中的最小值

和ve数组类似
如需要计算出vl[i]的正确值
vl[j1]~vl[jk]必须已经得到
这要求与ve数组刚好相反
也即需要在访问某个节点时保证它的后继节点均已经访问完毕
可通过逆拓扑序列来实现
在实现拓扑排序过程中使用栈来存储拓扑序列，按顺序出栈
访问逆拓扑序列中的每个事件V_{i}时
可遍历V_{i}的所有后继节点V_{j1}~V_{jk}
使用vl[j1]~vl[jk]来求出vl[i]

fill(v1, v1+n, ve[n-1])
while(!topOrder.empty())
{
int u = topOrder.top();
topOrder.pop();
for(int i = 0; i < G[u].size(); i++)
{
int v = G[u][i].v;
if(vl[v] - G[u][i].w < vl[u])
{
vl[u] = vl[v] - G[u][i].w;
}
}
}

－　按拓扑序和逆拓扑序分别计算各顶点［事件］的最早发生时间和最迟发生时间
ve[j]=max{ve[i]+length[i-->j]}
vl[j]=min{vl[j]-length[i-->j]}
－　用上面的结果计算各边［活动］的最早开始时间和最迟开始时间
最早：e[i-->j]=ve[i]
最迟：l[i-->j]=vl[j]-length[i-->j]
－　e[i-->j]=l[i-->j]的活动即为关键活动

主体部分代码［适用汇点确定且唯一的情况，以n-1号顶点为汇点为例］

// 不是有向无环图返回－１，否则，返回关键路径长度
int criticalpath()
{
memset(ve, 0, sizeof(ve));
if(topologicalSort() == false)
{
return -1;
}

fill(v1, v1+n, ve[n-1]);
while(!topOrder.empty())
{
int u = topOrder.top();
topOrder.pop();
for(int i = 0; i < G[u].size(); i++)
{
int v = G[u][i].v;
if(vl[v] - G[u][i].w < vl[u])
{
vl[u] = vl[v] - G[u][i].w;
}
}
}

for(int u = 0; u < n; u++)
{
for(int i = 0; i < G[u].size(); i++)
{
int v = G[u][i].v, w = G[u][i].w;
int e = ve[u], l = vl[v] - w;
if(e == 1)
{
printf("%d->%d\n", u, v);
}
}
}

return ve[n-1];
}

// 如果事先不知道汇点编号
// 如何求关键路径长度
// 即为取ve数组的最大值
// 因为所有事件中ve最大的一定是最后一个［或多个］事件，也即汇点

int maxLength = 0;
for(int i = 0; i < n; i++)
{
if(ve[i] > maxLength)
{
maxLength = ve[i];
}
}

fill(v1, v1+n, maxLength);

如果要完整输出所有关键路径
就需要把关键活动存下来，方法是新建一个邻接表，
当确定边u->v是关键活动时，将边u->v加入邻接表
这样最后生成的邻接表就是所有关键路径合成的图了
可用DFS遍历来获取所有关键路径

posted @ 2020-09-11 22:54 raindayinrain 阅读(197) 评论(0) 收藏举报

刷新页面返回顶部