第七次作业第2题独立路径数计算（DFS）

第七次作业第2题独立路径数计算（DFS）

为什么是DFS？

已经对DFS有良好理解的同学可以跳过这一部分。

首先回顾一下生成全排列的算法：

int visit[n], path[n];

void dfs(int level) {
    if (level == n) {             // 有明确的终止条件
        print(path);
        return ;
    }
    for (int i = 0; i < n; i++) { // 搜索所有可行选择
        if (!visit[i]) {          // 不会做出重复的选择
            visit[i] = 1;
            path[level] = i;      // 进行记录
            dfs(level + 1);
            visit[i] = 0;
        }
    }
}

int main() { dfs(0); }

借助全排列的过程，分析一下DFS的要素：

每次都面临多种选择，能够通过搜索找到所有可行的选择；
- 每次都遍历visit数组，从小到大寻找还未被使用过的数。
不会做出重复的选择；
- 每选择一个数，就将visit数组中的对应元素标为1；返回时则清空该标记。
能够记录曾经做出的选择，且该记录随着递归的调用而推进、随着递归的返回而回退；
- path数组记录了当前level之前选择的数，并将当前的选择记录在第level位。
有明确的终止条件；
- 每当填充到第n位时，一次排列生成，输出结果，并返回。

对应到本题的计算路径：

每个点都和多个点邻接；通过按边的序号从小到大搜索邻接的结点，恰好能按照路径边字典序找到所有路径。
每经过一个结点，就用visit做标记，使得之后不能再次经过；当从该结点搜索完毕返回时，又清空该标记，使得之后从别的路径又可以再次经过。
用path数组记录每个经过的边的编号，恰好就能保存路径。
每当搜索到终点时，找到一条路径，输出该路径，并返回。

总结一下，DFS的功能就是不重不漏地找到一个问题的所有可行解，这可能需要在熟练掌握递归的基础上有一定感性的认识。本次的作业题，其实就是对很多问题的高度抽象，即用暴力搜索的手段来求得一个难题的解。

本题存图的数据结构

邻接矩阵 or 链式边表？

邻接矩阵的含义是，用一个二维数组map[n][n]表示任意两点间的边关系。显然，在这种情况下，任意两点间只能存储至多一条边的信息；本题提到了，两个顶点之间有多条边时，边的序号会不同；因此，本题不能使用邻接矩阵。
- 邻接矩阵的优点：能够方便地按照点的序号有序地访问；能快速地查询任意两点间的边信息，查询效率高；只用数组，代码复杂度低。
- 邻接矩阵的缺点：遍历时要对图中所有结点的邻接性进行判断，遍历效率低；并且需要\(n^2\)的空间复杂度来存储。
链式边表的含义是，为每个结点建立一个链表，其中存储与该结点邻接的所有边。显然，这种方法对两点间边的数量没有限制，适用于本题。
- 链式边表的优点：每次访问都只访问到邻接的边，遍历效率高；占用的内存大小只和边数有关，空间复杂度低。
- 链式边表的缺点：每个点邻接的边的顺序需要手动维护；查询任意两点间的边信息需要遍历该点所有的邻接边，查询效率低；需要使用链表的数据结构，代码复杂度高。

静态数组 or malloc+指针？

使用数组和指针存储的实质都是一样的，都是从索引到数据的映射。区别在于：数组是从下标到数据的映射，指针是从地址到数据的映射。

在本题中，题目用标号描述结点和边，恰好就是整数到数据的映射；并且给定了标号的范围，因此使用静态数组是最优解。

建图注意事项&小技巧

用边表存图时，我们往往将一条无向边转化为两条有向边处理。对于每一条有向边，可以只存储这条边指向的终点。

struct Edge{
    int to;  // 终点的标号
    // 其他属于边的信息，如长度、路费等
    int next; // 链表中下一条边的标号，需初始化为-1
}edges[M * 2];

struct Node{
    int first; // 边链表中第一个结点的边标号，初始化为-1
    // 其他属于点的信息，如坐标、温度、人口数量等
}nodes[N];

但本题给每条边都标好了号，而我们又要用数组存图，没法让两条有向边共用一个下标，这该怎么办呢？

一种通用的思路，是采用两套标号系统。一套系统用来表示题目中的标号，只用该标号排序和输出；另一套系统用于我们的链式边表。但这样就丧失了用数组存储的意义，直接用malloc+指针反而更为方便。

对于本题来说，一种巧妙的做法，是将题目给定的边号乘上2，再分别+0和+1后，作为两条有向边的新编号；排序时原先的大小关系没有改变，输出时只要将新编号除以2就能得到原编号，可谓是一举两得。

int main() {
    ...
    // 读入信息：边标号为e，两点标号为v1 v2
    // 转化为两条有向边
    buildEdge(v1, v2, e*2+0); // 从v1到v2，边标号转化为e*2+0
    buildEdge(v2, v1, e*2+1); // 从v2到v1，边标号转化为e*2+1
}

下面的关键就是书写buildEdge(from, to, e)函数了，它的含义是增加一条从from到to的标号为e的边。由于是链式边表存图，该函数就是需要将边e插入到from结点存储的边链表中。又由于题目要求按字典序输出所有路径，我们需要保证每个链表中边的标号都从小到大排列。

为了保证链表元素的有序性，有两种做法：一是每次都找到正确的位置插入；二是先将所有边按标号排序，再依次插入到每个链表头部。由于后者可以借助qsort降低排序和插入的代码复杂度，且时间复杂度也十分优秀，这里用后者为例。

struct Tmp{
    int e, vi, vj;
}tmpData[1005];

int main() {
    ...
    for (int i = 0; i < e; ++i) 
    	scanf("%d%d%d", &tmpData[i].e, &tmpData[i].vi, &tmpData[i].vj);
    qsort(tmpData, e, sizeof Tmp, cmp); //将读入的所有边按e值从大到小排列
    for (int i = 0; i < e; ++i) {
        buildEdge(tmpData[i].vi, tmpData[i].vj, tmpData[i].e * 2 + 0);
        buildEdge(tmpData[i].vj, tmpData[i].vi, tmpData[i].e * 2 + 1);
    }
    ...
}

void buildEdge(int from, int to, int e) {
    edges[e].to = to;
    // 直接插入到链表头部
    edges[e].next = nodes[from].first;
    nodes[from].first = e;
}

到这里，本题建图的部分就大功告成；接下来就是参考全排列的算法依葫芦画瓢，书写DFS。

用DFS进行搜索

显然，dfs函数需要至少两个参数：一是当前搜索到的结点，二是当前的深度（用来记录路径）。

int path[N], visit[N];
void dfs(int now, int depth);
int main() {
    ...
    visit[0] = 1;
    dfs(0, 0);
    ...
}

终止条件：
- 当前搜索到的结点now为终点时，表示找到一条路径；用for (int i = 0; i < depth; ++i) printf("...", path[i]);输出路径记录数组中记录的路径（标号要除以二再输出），并返回。
遍历选择：
- 用for(int e = nodes[now].first; e != -1; e = edges[e].next)遍历当前now结点邻接的所有边，并用int to = edges[e].to访问该边到达的结点。
保证不重：
- 先判断visit[to]，只有当未访问过时才访问to。
记录路径
- 如果未访问过，则立即将visit[to]置为1，同时记录路径path[depth] = e；
- 进行递归调用dfs(to, depth+1);；
- 返回后，将visit[to]恢复为0，继续搜索下一个可行的邻接结点。

参考递归实现的全排列，即可轻松完成上面的算法。相信你已经能够掌握DFS的奥妙了。

posted on 2020-06-01 01:53 Stitch11752 阅读(657) 评论(0) 编辑收藏举报

刷新页面返回顶部

Stitch11752