强连通分量——Tarjan算法
http://www.byvoid.com/blog/scc-tarjan/
强连通分量是有向图中的概念,我们先说强连通分量的定义吧:在一个图的子图中,任意两个点相互可达,也就是存在互通的路径,那么这个子图就是强连通分量(或者称为强连通分支)。如果一个有向图的任意两个点相互可达,那么这个图就称为强连通图。
我们常用的求强连通分量的算法有两个,一个是Kosaraju算法,这个算法是基于两次dfs来实现的;还有一个就是Tarjan算法,这个算法完成一次dfs就可以找到图中的强连通分支。我的这篇文章主要介绍Tarjan算法。
Tarjan算法是基于这样一个原理:如果u是某个强连通分量的根,那么:
(1)u不存在路径可以返回到它的祖先
(2)u的子树也不存在路径可以返回到u的祖先。
因此我们在实现Tarjan算法的时候,使用dfsnum[i]记录节点i被访问的时间,也可以理解为在访问该点之前已经访问的点的个数。然后使用数组low[i]记录点i或者i的子树最小可以返回到的节点(在栈中)的次序号。
这里还要说一下low[i]的更新过程,
if(v是i向下dfs的树边) low[i]=min(low[i],low[v]);//这里也就是说low[i]表示i或者i的子树所能追回到的最小的点序号。
if(v不是树边也不是横叉边) low[i]=min(low[i],dfsnum[v]);//其实这里你直接更新成low[v]代替dfsnum[v]也是可以的
根据上面的原理,我们可以发现只有当dfsnum[i]==low[i]的时候就正好是强连通分量的根。这个时候我们把在栈中的点(在遇到根之前在栈中的点)出栈,并且标记好点所属的强连通分支的编号。
整个Tarjan算法跑下来就可以完成强连通分支的求解了。
#include<iostream>
#include<vector>
using namespace std;
const int MAX=10001;
int Stop;//栈中的元素个数
int cnt;//记录连通分量的个数
int visitNum;//记录遍历的步数
int DFN[MAX]; //记录节点u第一次被访问时的步数
int LOW[MAX]; //记录与节点u和u的子树节点中最早的步数
bool instack[MAX];//记录节点u是否在栈中
int Stap[MAX];//栈
int Belong[MAX];//记录每个节点属于的强连通分量编号
int N;//节点个数
vector<int> tree[MAX];
void tarjan(int i)
{
int j;
DFN[i]=LOW[i]=++visitNum;
instack[i]=true;
Stap[++Stop]=i;//将当前节点压入栈中
for (unsigned k=0;k<tree[i].size();k++)
{
j=tree[i][k];
if (!DFN[j]) //j还没有被访问过
{
tarjan(j);
//父节点是子节点的子节点
if (LOW[j]<LOW[i])
LOW[i]=LOW[j];
}
//与j相连,但是j已经被访问过,且还在栈中
//用子树节点更新节点第一次出现的时间
else if (instack[j] && DFN[j]<LOW[i])
LOW[i]=DFN[j];
}
//节点i是强连通分量的根
if (DFN[i]==LOW[i])
{
cnt++;
//输出找到的强连通分量
cout<<"连通分量"<<cnt<<": ";
//退栈,直至找到根为止
do
{
j=Stap[Stop--];
instack[j]=false;
cout<<j<<" ";
Belong[j]=cnt;
}
while (j!=i);
cout<<endl;
}
}
void solve()
{
Stop=cnt=visitNum=0;
memset(DFN,0,sizeof(DFN));
for (int i=1;i<=N;i++)
if (!DFN[i])//有可能图不是连通图
tarjan(i);
}
int main()
{
N=6;
tree[1].push_back(3);
tree[1].push_back(2);
tree[2].push_back(4);
tree[3].push_back(5);
tree[3].push_back(4);
tree[4].push_back(1);
tree[4].push_back(6);
tree[5].push_back(6);
solve();
for(int i=1;i<=N;i++)
cout<<Belong[i]<<" ";
cout<<endl;
return 0;
}