Tarjan 算法详解
一个神奇的算法,求最大连通分量用O(n)的时间复杂度,真实令人不可思议。
废话少说,先上题目
题目描述:
给出一个有向图G,求G连通分量的个数和最大连通分量。
输入:
n,m,表示G有n个点,m条边
下面m行每行包含 x,y,表示有一条x到y的有向边
输出:
第一个数表示连通分量的个数,第二个数代表最大连通分量
输入示例(如下图)
6 8 1 2 1 4 2 3 2 5 3 6 4 5 5 1 5 6
输入示例
4 3
很多人会想到DFS,但是时间复杂度为O(n^2),但是时间容易超限,所以我们要用到Tarjan
先理清一下概念:
连通分量:对于图G来的一个子图中,任意两个点都可以彼此到达,这个子图就被称为图G的连通分量(一个点就是最小的连通分量)
最大连通分量:对于图G的一个子图,这个子图为图G的连通分量,且是图G所有连通分量中包含节点数最多的那个,即为G的最大联通分量
时间戳:搜索时第几个搜索到这个点。如搜索顺序是1->2->3->6则6的时间截为4
下面就是tarjan的思路(第一次看不懂可以跳过,直接看详细步骤,回来再看):
每个点都有两个参数:low,dfn。dfn表示这个点的时间戳,而low代表这个点所能到达的最小的时间戳,开始low都等于dfn,但会经过不断更新而减少。
从1节点进行深度优先搜索,途中用树(一个转化为栈的树)维护。
当遇到一个点时,有如下判断:
1、如果这个点没有访问过,就将这个点加入树(栈)
2、如果这个点访问过,且在树(栈)里,与这个点的low比较,更新自己的low
返回时更新low
当一个点遍历所有的边后这个点的low还是等于dfn,将个点及以上出栈,这个点及栈以上的点构成一个连通分量。
来一点Chinese++(就是伪代码)
void tarjan(int 当前点) { 这个点的low=dfn=时间戳; 将这个点入栈; 标记这个点入栈; 枚举这个点连接的所有边 { 如果目标点没有被访问过 { tarjan(目标点); 更新当前点的low; } 如果目标点被访问过 { 更新当前点的low; } } 如果当前点的low==dfn { 将这个点及栈以上的点出栈,标记成一个强连通分量; ans++; } }
详细过程:
开启黑暗之门
开始,从1节点开始,时间截和low都是1,将1入栈
stack:1,
走到2节点,2的时间戳dfn和low都是2,2入栈
stack:1,2
以此类推,将3、6入栈,时间戳分别为3、4
stack:1,2,3,6
此时,发现6节点遍历了其所有出边(本来就没有)以后,它的low等于dfn,这就说明了6号节点没有路径能回到能到达它的节点,所以6就是一个单独的连通分量,因此将6出栈,再回溯,此时在栈中比6(含)高的点都出栈,这些点构成一个连通分量(因为此时比6在栈顶,所以6是一个单独的连通分量)ans++
stack:1,2,3
和刚才一样,3节点的所有出边已经遍历一般,但low还是和dfn相等,所以3出栈,因为此时3在栈顶,所以3是一个单独的连通分量。ans++
stack:1,2
再次遍历从2遍历到5,将5入栈,并且low和dfn都为5。
stack:1,2,5
然后5搜索到6,但是6不在栈里面,所以不管它
这是搜索到了1,发现1的时间戳1小于5的low,所以将5的low更新为1,。这时发现5没有其他边可以走了,所以返回
返回到2时,发现5的low比2的low小,所以更新2的low为1,继续返回到1
再从1走到4,4的时间戳和low为6,将4入栈
stack:1,2,5,4
从4走到5,发现5在栈中,且5的low比4的low小,所以4的low变成1,因为没有边再返回到1
此时,1的所有边都走完啦,并且1的low等于dfn,所以把1及以上的节点出栈,构成连通分量,ans++
继续枚举每一个点,如果这个点的时间戳为0(也就是没有访问过)tarjan(i);
现在贴上代码,但是没有完,我会对原理做详细解释:
void tarjan(int u) { in++; dfn[u]=in; low[u]=in; S.push(u); vis[u]=1; for(int e=head[u];e;e=next[e]) { if(!dfn[to[e]]) { tarjan(to[e]); low[u]=min(low[to[e]],low[u]); } else if(vis[to[e]]) low[u]=min(low[u],dfn[to[e]]); } if(low[u]==dfn[u]) { while(!S.empty() && S.top()!=u) { vis[S.top()]=0; S.pop(); } vis[u]=0; S.pop(); ans++; } }
演员表:
in:时间戳下标
dfn[i]:i节点的时间戳
low[i]:i所能到达的最小的时间戳
head[i],next[i],to[i]:邻接表群演
vis[i]:i是否在栈里
S:栈
ans:计数
u:当前点
原理详解:
1、其实虽说整个过程都在用栈维护,但是原理却是一颗树,比如当搜索到1、2、3、6时,树是这样的
你想象成树就好,当我们确定6为一个单独的连通分量的时候,把它咔嚓掉。现在6及以下的节点(这次没有)成为一颗新的树。
然后再用霜之哀伤砍掉3,3及以下节点(也是没有)又变成了一个新的树。
然后我们搜索到5,将5加入树
然后再从1搜索到4,加入树
然后返回到1,拔出1节点的霜之哀伤与耐奥祖融合,成为新的巫妖王。
这就是Tarjan的关于连通分量个数的应用了,后续会带来割点割边。