DFS剪枝与搜索

前言
例题

前言

设计DFS搜索首先要保证的是: 设计合理的搜索顺序，能够涵盖所有的状态。

然而DFS搜索的状态数量是按照指数级别增长，而且这些状态有些是'无用的'，为此，我们需要通过剪枝策略去减少搜索的状态，从而提高DFS的效率

DFS的剪枝策略可以分为5大类：

优化搜索顺序
排除等效冗余
可行性剪枝
最优化剪枝
记忆化搜索(DP)

其中记忆化搜索主要用在DP上。

对于要使用DFS搜索的题目，我们就可以从以上这几个角度去出发，发掘题目中的种种性质，从而减少搜索的方案数，优化搜索的复杂度

当然，减少递归的层数能够减少系统资源的利用，从而加快程序的运行速度

例题

小猫爬山

题目链接]

读完题意之后，我们可以从这样去设计搜索的顺序：

每个猫咪看作搜索的层数，看猫咪能放入哪个缆车中

对于每只小猫，有两种安置的策略：

把小猫放置在已经租用的缆车中
把小猫放在新的缆车中

这种搜索顺序可以涵盖所有的可能，确定好搜索顺序之后，再分析一下剪枝

剪枝:

优化搜索顺序：

先搜索体积大的猫，那么缆车最后存放的猫的数量也就越少，搜索的方案也就越少

排除等效冗余：

本题的搜索顺序是不存在等效冗余的，所以无法从这个角度切入

可行性剪枝：

只有当前缆车的空余容量大于某个小猫的体积

最优化剪枝：

首先，答案肯定不会超出猫咪的数量

其次，当搜索的结果大于答案，则当前的方案肯定不会是最优解，所以可以提前结束搜索，进行剪枝

那么最终，我们可以根据这些分析，写出本题的代码啦

#include <iostream>
#include <algorithm>
using namespace std;

constexpr int N = 20;
int c[N], n, m, res;
int w[N];

void dfs(int u, int cat) {
    // 最优化剪枝
    if (u >= res) return;
    // 安置好最后一个小猫
    if (cat > n) {
        res = u;
        return;
    }

    for (int i = 1; i <= u; i++) {
        if (w[i] >= c[cat]) { // 可行性剪枝
            w[i] -= c[cat];
            dfs(u, cat + 1);
            w[i] += c[cat];
        }
    }
    w[u + 1] -= c[cat];
    dfs(u + 1， cat + 1);
    w[u + 1] += c[cat];
}

int main() {
    cin >> n >> m;
    fill(w, w + N, m);
    res = n;
    for (int i = 1; i <= n; i++) cin >> c[i];
    // 优化搜索顺序
    // 因为体积越大的猫，下面的节点就越少，搜索的状态也就越少
    sort(c + 1, c + n + 1, greater<int>());
    dfs(1, 1);

    cout << res << '\n';

    return 0;
}

分成互质组

题目链接

本题有两种可行的搜索顺序:

固定组，看看有哪些数可以放到这个组里
固定数，看看这个数能放到哪些组里

对于这两种搜索顺序，是无法从优化搜索顺序和排除等效冗余角度入手的，接下来会分别对这两种搜索顺序从其可以入手的剪枝策略进行分析

顺序1：固定组

搜索顺序：依次枚举所有元素，看其能否加入当前组，否则开辟新组存下此元素

剪枝：

可行性剪枝：

判断当前元素能否放入该组中，如果能则将该元素存入当前组中，继续向下搜索
最优化剪枝：

如果当前答案大于最优答案，那么无需继续向下搜索
排除等效冗余：

从start开始枚举，确保枚举的每组数据的组合只出现一次

#include <iostream>
using namespace std;
constexpr int N = 14;
int a[N], n, ans, group[N][N];
bool st[N]; // 标记第i个元素是否属于某个组

int gcd(int a, int b) {return b ? gcd(b, a % b) : a; }

inline bool check(int g[], int n, int x) {
    for (int i = 0; i < n; i++)
        if (gcd(g[i], x) > 1) return 0;
    return 1;
}

void dfs(int u, int c, int sum, int start) {
    // 最优化剪枝
    if (u >= ans) return;
    if (sum == n) {
        ans = u;
        return;
    }

    bool ok = 1;
    for (int i = start; i < n; i++) 
        // 可行性剪枝
        if (!st[i] && check(group[u], c, a[i])) {
            st[i] = 1;
            group[u][c] = a[i];
            dfs(u, c + 1, sum + 1, i + 1);
            st[i] = 0;
            ok = 0;
        }
    if (ok) dfs(u + 1, 0, sum, 0);
}


int main() {
    cin >> n;
    ans = n;
    for (int i = 0; i < n; i++) cin >> a[i];
    dfs(1, 0, 0, 0);

    cout << ans << '\n';
    return 0;
}

顺序2：固定元素

搜索顺序：对于当前元素，看其能否放入已有的组中，或者开辟新组存下该元素

剪枝：

可行性剪枝：

如果当前元素能存放在该组中, 那么存下该元素继续搜索
最优化剪枝：

如果当前答案大于最优答案，那么无需继续向下搜索

如果当前元素能放入一个已经存在组内，那么就没有必要去搜索放入其他已经存在的组

#include <iostream>
#include <vector>
using namespace std;
using VI = vector<int>;

constexpr int N = 11;
int a[N], w[N], n, res;
VI g[N];
bool st[N];

int gcd(int x, int y) { return y ? gcd(y, x % y) : x; }

inline bool check(VI g, int x) {
    for (int i : g)
        if (gcd(i, x) > 1)
            return 0;
    return 1;
}

void dfs(int u, int num) {
    // 最优化剪枝
    if (u >= res) return;
    if (num >= n) {
        res = u;
        return;
    }

    int c = a[num];
    for (int i = 1; i <= u; i++) {
        // 可行性剪枝
        if (check(g[i], c)) {
            /* 如果一个元素能放入一个组内，那么直接放进去，
             * 不需要考虑能不能放进其他的组
             */
            g[i].push_back(c);
            dfs(u, num + 1);
            g[i].pop_back();

            break;
        }
    }

    g[u + 1].push_back(c);
    dfs(u + 1, num + 1);
    g[u + 1].pop_back();
}

int main() {
    scanf("%d", &n);
    // 一个小小的最优化剪枝
    res = n;
    for (int i = 0; i < n; i++) scanf("%d", &a[i]);
    dfs(1, 0);

    cout << res << '\n';

    return 0;
}

本题小结

虽然这两种搜索顺序的剪枝策略差不太多，但是顺序2的速度是顺序1的\(30\)多倍。也由此可见，搜索顺序的选择对DFS速度的影响也极其重要

数独

题目链接

本题不光需要剪枝，还需要二进制状态表示等小技巧

搜索顺序：

选取九宫格中的一个格子，将其填满，之后再选另一个格子填满……

剪枝：

优化搜索顺序：

每次选填过的最多的格子，因为选过的格子越多，那么往后枚举的可能也就越少

可行性剪枝：

当前位置的列、行和所在的九宫格都没有填过数字\(x\)，那么这个数字是可填的

其他的优化：

对于每一列、行、和九宫格填过数字的状态，我们可以用二进制来表示，1代表每天过，0代表填过
对于求一个九宫格中有多少个没有填过的数，我们可以提前预处理出所有二进制的状态，统计每个状态中有多少个1
判断当前格子能否填数，我们可以去这个格子所在的行、列和九宫格的状态的&，得到二进制中只有一个1的数字。找到1出现的位置加上1，得到的结果就是可以填的数字。同样的，这个状态中1出现的位置也可提前预处理出来
可以用lowbit去快速计算一个状态中可以填的数字的位置

#include <bits/stdc++.h>
using namespace std;

constexpr int N = 9, M = 1 << N;

int row[N], col[N], f[3][3];
char s[N * N + 5];
int loc[M], Count[M];

inline int lowbit(int x) { return x & -x; }

inline void init() {
  for (int i = 0; i < N; i++) col[i] = row[i] = (1 << N) - 1;
  for (int i = 0; i < 3; i++)
    for (int j = 0; j < 3; j++) f[i][j] = (1 << N) - 1;
}

int get(int x, int y) { return row[x] & col[y] & f[x / 3][y / 3]; }

inline void update(int x, int y, int v, bool type) {
  if (type) {
    s[x * N + y] = '1' + v;
  } else s[x * N + y] = '.';

  int t = 1 << v;
  if (!type) t = -t;

  row[x] -= t;
  col[y] -= t;
  f[x / 3][y / 3] -= t;
}

bool dfs(int cnt) {
  if (!cnt) return 1;
  int x, y, maxv = 12;
  for (int i = 0; i < N; i++)
    for (int j = 0; j < N; j++) {
      if (s[i * N + j] != '.') continue;
      int n = Count[get(i, j)];
      if (n < maxv) maxv = n, x = i, y = j;
    }

  for (int i = get(x, y); i; i -= lowbit(i)) {
    int c = loc[lowbit(i)];
    update(x, y, c, 1);
    if (dfs(cnt - 1)) return 1;
    update(x, y, c, 0);
  }

  return 0;
}

int main() {
  for (int i = 0; i < N; i++) loc[1 << i] = i;
  for (int i = 0; i < 1 << N; i++)
    for (int j = i; j; j -= lowbit(j)) Count[i]++;

  while(cin >> s && s[0] != 'e') {
    init();
    int cnt = 0;
    for (int i = 0; i < N; i++)
      for (int j = 0; j < N; j++) if (s[i * N + j] != '.') {
        update(i, j, s[i * N + j] - '1', 1);
      } else cnt++;
    dfs(cnt);

    puts(s);
  }

  return 0;
}

木棒

题目链接

这里称短的为木棒，组成后长的为木棍

搜索顺序：

首先，搜索的木棍的长度一定是所有木棒长度的因数，那么我们可以枚举木棒总长度的因数作为木棍的长度去搜索。问题就转化为了让不同的木棒组称几个长度相同的组

我们可以依次枚举所有的木棒，如果当前的木棒能放入当前木棍的组中，那就放入组中，继续搜索下一个木棒;否则就放到下一个组中，从头去搜索没有放入的木棍。

搜索顺序：

优化搜索顺序：

搜索时按照木棒长度从大到小开始搜索，那么之后木棒的可用的空间就就少了，对应的搜索的状态也随之减少

排除等效冗余：

按照木棒的下标从小到大进行搜索，这样就能避免等效冗余(组合的方式枚举)

可行性剪枝：
设枚举木棒的长度为\(len\)，木棒的组数为\(n\)，如果有\(n\times len>sum\)，那么该状态一定不合法
如果某个长度的木棒无法放入，那么后面相同长度的木棍也肯定无法放入
如果第一个木棒的长度大于木棍的长度，那么该方案一定不合法
如果最后一个木棒\(x\)摆放失败了，那么该方案也一定不合法(反证法:如果存在其他组能让\(x\)摆放成功的话，那么调换木棒的摆放顺序，让\(x\)成为最后摆放的木棍，那么就与先前的结论矛盾了)

#include <iostream>
#include <algorithm>
using namespace std;
constexpr int N = 210;

int n, a[N], sum, len;
bool st[N];

bool dfs(int u, int start, int size) {
    if (len * u == sum) return 1;
    if (size == len) return dfs(u + 1, 0, 0);

    for (int i = start; i < n; i++) {
        // 可行性剪枝
        if (st[i] || a[i] + size > len) continue;
        st[i] = 1;
        if (dfs(u, start + 1, size + a[i])) return 1;
        st[i] = 0;
        if (!size || size + a[i] == len) return 0;
        int j = i;
        while (j < n && a[i] == a[j]) j++;
        i = j - 1;
    }
    return 0;
}

int main() {
    while (scanf("%d", &n) != EOF && n) {
        // init
        fill(st, st + n + 1, 0);
        sum = 0, len = 0;
        for (int i = 0; i < n; i++) cin >> a[i], sum += a[i];
        // 优化搜索顺序
        sort(a, a + n, greater<int>());

        while (++len <= sum) {
            if (sum % len == 0 && dfs(1, 0, 0)) {
                printf("%d\n", len);
                break;
            }
        }
    }

    return 0;
}

生日蛋糕

原题链接

题目分析：

蛋糕的搜索顺序有两种：自上而下，自底向上。由于给定的体积是固定的，而且体积是自底向上减少的，所以我们应该选择第二个搜索顺序，减少枚举的状态，从而实现对搜索顺序的优化

我们首先需要对蛋糕进行一下分析，看看根据题目中的信息能获取哪些信息：

根据题目中的信息，我们可以写出蛋糕的面积和体积的公式

\(n=\sum^m_{i=1}{R_i^2H_i}\)，\(Ans=\sum_{i=1}^m2R_iH_i+R_m^2\)

对于第\(u\)层蛋糕，我们可以确定半径和高的取值范围：\(u\le R_u< R_{u+1}-1\)，\(u\le H_u< H_{u+1}-1\)。同理，我们也可以推测出\(R\)和\(H\)都去最小值时前\(u\)层的体积和表面积
对于第\(u\)层，若上一层的体积是\(v\)，那么有\(n-v\ge \sum R_i^2H_i\ge R_i^2\)，可以得到\(R_i\le \sqrt{n-v}\)，\(H_i\le \frac{n-v}{R_i^2}\)。所以每一层的面积的取值有\(u\le R_u< \min({R_{u+1}-1, \sqrt{n-v}})\)，体积的取值有\(u\le H_u< \min(H_{u+1}-1,\frac{n-v}{R_i^2})\)
寻找体积和面积的关系：
首先对面积进行缩放：

\[ Ans = R^2_m+2\sum_{i=1}^uR_iH_i\\ =R_m^2+\frac{2}{R_{u+1}}R_iR_uH_i\\ \because \frac{2}{R_{u+1}}R_iR_uH_i<\frac{2}{R_{u+1}}R_i^2H_i =\frac{2}{R_{u+1}}n-v\\ \therefore Ans<\frac{2(n-v)}{R_{u+1}} \]

所以我们可得到剪枝的方案：

优化搜索顺序：自底向上进行搜索
可行性剪枝：
如果当前体积(面积)加上前\(u\)层最小体积(面积)大于\(n\)(\(Ans\))，那么该方案不可行
每一层的面积的取值有\(u\le R_u< \min({R_{u+1}-1, \sqrt{n-v}})\)，体积的取值有\(u\le H_u< \min(H_{u+1}-1,\frac{n-v}{R_i^2})\)
Ans要满足\(Ans<\frac{2(n-v)}{R_{u+1}}\)

#include <bits/stdc++.h>
#define io ios::sync_with_stdio(false); cin.tie(0); cout.tie(0)
using namespace std;

constexpr int N = 22, INF = 0x3f3f3f3f;

int n, m, ans = INF;
int mins[N], minv[N], R[N], H[N];

void dfs(int u, int s, int v) {
  if (v + minv[u] > n) return;
  if (s + mins[u] >= ans) return;
  if (s + 2 * (n - v) / R[u + 1] >= ans) return;
  if (!u) {
    if (v == n) ans = s;
    return;
  }

  for (int r = min(R[u + 1] - 1, (int)sqrt(n - v)); >= u; r--)
    for (int h = min(H[u + 1] - 1, (n - v) / r / r); h >= u; h--) {
      int t = 0;
      if (u == m) t = r * r;
      R[u] = r, H[u] = h;
      dfs(u - 1, s + t + 2 * r * h, v + r * r * h);
    }
}

int main() {
  io;
  cin >> n >> m;
  for (int i = 1; i <= m; i++) {
    mins[i] = mins[i - 1] + 2 * i * i;
    minv[i] = minv[i - 1] + i * i * i;
  }

  R[m + 1] = H[m + 1] = INF;

  dfs(m, 0, 0);
  
  if (ans == INF) ans = 0;
  cout << ans << '\n';

  return 0;
}

可见本题的剪枝策略主要来自对于公式的推导

posted @ 2021-12-04 16:42 Frank_Ou 阅读(161) 评论(0) 编辑收藏举报

刷新页面返回顶部

Loading

Frank_Ou's Blog

DFS剪枝与搜索

前言

例题

小猫爬山

分成互质组

顺序1：固定组

顺序2：固定元素

本题小结

数独

木棒

生日蛋糕

公告