DancingLinks简介(转)

 

              Dancing Links 在搜索中的应用 

1.1    Dancing Links是什么 

     Dancing Links  knuth 在近几年写的一篇论文,在我看来是一类搜索 

问题的通用优化因此我把它写下来,希望能在竞赛中得到一定的应用。 

1.2    Dancing  Links的主要原理是什么 

     Dancing Links 主要是用双向十字链表来存储稀疏矩阵,来达到在搜索 

中的优化。在搜索问题中,所需要存储的矩阵往往随着递归的加深会变得越 

来越稀疏,这种情况用Dancing Links 来存储矩阵,往往可以取得非常好的 

效果。 

1.3    这篇论文与knuth论文的不同 

     本篇论文是对Dancing Links 在竞赛的应用的一个介绍,并列举了几个 

竞赛中的例题。原文可以在此下载到: 

     http://www.ocf.berkeley.edu/ jchu/publicportal/sudoku/0011047.pdf 

     相对于本文,我更建议去读者去看knuth的原文,本文可以当作一个参 

考。本文还介绍了Sukudo问题和一个Dancing Links的一个变种问题。 

                             2     双向链表 

2.1    双向链表的存储结构 

     双向链表的存储结构往往是有一个空的结点来表示头指针。然后每一 

个结点有一个pre值域和一个next值域。如果是十字链表的话,结点中指针 

的值域会变成四个。 

2.2    双向链表的应用 

     众所周知,在单向链表中删除一个结点是非常麻烦,而且低效的。双向 

链表有着优美的结构,可以方便的删除任意一个结点。有如下操作: 

                     L[R[x]]  =  L[x],  R[L[x]] =   R[x];                  

相信有写过双向链表经验的人对这两句话一定不会陌生

2.3    双向链表的恢复 

     在双向链表中删除一个结点只要用(1) 就可以了,然后来看下面这一段 

代码: 

                        L[R[x]] = x, R[L[x]] = x;                     (2) 

这段代码会将已经删除掉的结点,重新添加回双向链表中。第一次看到这段 

代码的你是不是会感觉非常奇妙?你有可能会说在链表中进行删除操作但 

是不释放内存的话是不好的编程习惯,会造成内存溢出错误。但是在这里, 

我们要的就是这样的效果。 

     我们在链表中删除,只是进行一个标记,并不进行真正的清空内存操 

作。这样我们后来便可以用(2) 进行恢复操作了。 

     你也有可能会说这段代码会有什么用?下面就让我们来真正看看(2) 强 

大的威力。(2)才是Dancing Links  的核心

                  3    Exact  Cover Problem 

3.1    Description 

     上节所说的双向链表的恢复操作会在本节中有重要的作用。下面先让 

我们来看一个问题(Exact Cover Problem)。 

     给定一个01矩阵现在要选择一些行,使得每一列有且仅有一个1.  例子 

如下: 

                          0   0  1   0  1  1   0  

                          1   0  0   1  0  0   1 

                          0   1  1   0  0  1   0                   (3) 

                          1   0  0   1  0  0   0 

                          0   1  0   0  0  0   1  

                          0   0  0   1  1  0   1  

对于如上所示的矩阵(3),我们取行集合{1, 4, 5} 便可使每一列有且仅有一 

1。 

3.2    Solving  an  exact  cover problem 

     很明显,exact cover problem 是一个无法用多项式算法解决的问题,解 

决方法只有搜索!  且看如下搜索代码: 

if  (A is  empty)  { \\A  is  the 0-1  matrix. 

     the problem   is solved; 

     return  ; 

choose  a  column,  c, 

     that  is unremoved   and  has fewest   elements.;      ...(1) 

remove  c  and each  row  i that  A[i][c]   == 1  from  matrix  A;     ...(2) 

for  (all  row,  r, that  A[r][c]  ==  1)  { 

     include  r  in the  partial  solution.; 

     for each  j  that  A[r][j]  ==  1 { 

         remove   column  j and  each  row  i 

              that  A[i][j]   == 1 from  matrix   A. ...(3) 

     } 

     repeat  this  algorithm   recursively   on the  reduced   matrix  A. 

     resume  all  column  j and  row  i that  was  just  removed;  ...(4) 

resume  c  and i  we removed   at step  (2)    ...(5); 

上述代码是一个普通的搜索过程,如果你觉得比较陌生,可能是因为跟你平 

时所用的搜索方法有些不同,但本质上必定是相同的。 

     我们要做的,是去优化这段代码,但这段代码的算法框架已经固定 , 

几乎没有可优化的余地,就算用非递归来优化也不会得到多少的效率提升, 

反而会使编码复杂度和出错率大大增加。 

     如何去实现代码行(1) (2) (3) (4) 是优化的关键,也是Dancing Links发 

挥其作用的地方。我们可以直观的去想到一个简单的方法: 

 Step (1):  把矩阵进行扫描,选出未做删除标记的列中元素个数最少的。如 

     果你不理解为什么选最少的,可以当它是随便选取的,不影响正确性。 

 Step (2):  对当前列和行做标记,标记其已经删除。 

 Step (3): Step (2) 

 Step (4):  把相应的标记删除。 

 Step (5): Step (4) 

   1Step  (1)中有一个巨大的优化,就是选取最少元素的列,但这是搜索优化问题,与我们讨论的重点Dancing  Links没多大关系,固不做过多论述.然而,这个方法很明显是非常低效的,做标记是快速的。但是相应的带来的问题,是查找的时候会变得非常慢。复杂度始终是O(n)(n为矩阵大小)。 

step (1) (2) (3) (4) (5)  中我们都用到了查找操作,所以我们不能忽视查找的复杂度。在这个实现方式中,把查找的效率提升多少,整个程序便可提升多少。 

     我们再做观察,还可发现,矩阵随着递归的深入便会变得越来越稀疏。而我们所对应的查找操作,却没有利用这一特性,一直在盲目的进行查找。 

     或许有读者会自然而然的想到链表。链表可以高效的支持删除操作,链表的长度也是随着删除操作的执行而变短,不会存在上述做法的问题。 

     从前面的论述,我们知道了程序的瓶颈在于查找操作。因为矩阵会越来越稀疏,所以我们可以直观的感觉到把链表用在此处,会及大的提高效率。 

     有了链表,我们的查找操作只用到了遍历链表,因为已经被标记删除的结点是不存在在链表中的。很显然用链表的话查找操作的效率已经提升到了极致,不可能再提升了。 

     有人可能会发现问题,我们在链表中删除结点是容易,可是恢复容易吗?Step (4) (5) 该如何实现呢?哈哈,请看本论文开头对双向链表的介绍,看似无用的双向链表的恢复操作,在这里不是正好用上吗? 

     好了,到这里,已经把Dancing Links基本介绍完了。如果你真正理解了,可能会惊叹,这么简单呀!这就是Dancing  Links吗?但是Dancing  Links的强大之处还得等到自己实践之后才能体会到。下面我们来细细展开Dancing Links。 

3.3    The  Dance  Steps 

     一个比较好的实现方式是用数组来模拟链表,这样也可方便的建立矩阵,也可以加快运行速度。对每一个对象,记录如下几个信息: 

   *  L[x], R[x], U[x], D[x], C[x]; 

   *  双向十字链表用LRUD来记录,LR来记录左右方向的双向链表,UD来记录上下方向的双向链表。 

   *  head 指向总的头指针,head通过LR来贯穿列指针头。 

   *  每一列都有列指针头。C[x]是指向其列指针头的地址。行指针头可有可无,在我的实现中没有显示的表示出来。在某些题目中,加个行指针头还是很有必要的。 

   *  另外,开两个数组S[x], O[x];  S[x]记录列链表中结点的总数。O[x]用来记录搜索结果。 

                             图1:  矩阵A的表示 

0-1矩阵(3)的存储图形如图(1)所示。 

   *  h代表总的头链表head. 

   *  ABCDEFG为列的指针头。 

     Exact Cover Problem的完整c代码如下所示,调用过程为dfs(0)。 

void  remove(const     int  &c)  { 

//remove   column   c  and  all  row  i that  A[i][c]   ==  1 

     L[R[c]]   =  L[c]; 

     R[L[c]]   = R[c]; 

     //remove   column   c; 

     for  (int  i  = D[c];   i !=  c;  i =  D[i])  { 

     //remove   i  that  A[i][c]   ==  1 

          for  (int  j  = R[i];   j !=  i;  j =  R[j])  { 

               U[D[j]]   = U[j]; 

               D[U[j]]   = D[j]; 

               --S[C[j]]; 

               //decrease    the  count  of  column   C[j]; 

          } 

     } 

void  resume(const    int &c)  { 

     for  (int  i = U[c];   i !=  c; i  = U[i])  { 

          for (int  j  = L[i];  j  != i;  j =  L[j])  { 

              ++S[C[j]]; 

              U[D[j]]   = j; 

              D[U[j]]   = j; 

          } 

     } 

     L[R[c]]  =  c; 

     R[L[c]]  =  c; 

bool  dfs(const   int  &k)  { 

     if  (R[head]  ==  head)  { 

          One of  the  answers  has  been  found. 

          return  true; 

     } 

     int  s(maxint),   c; 

     for  (int  t = R[head];   t  != head;  t  = R[t])  { 

     //select   the column   c which  has  the  fewest  number   of element. 

          if (S[t]   < s)  { 

               s = S[t]; 

               c = t; 

          } 

     } 

     remove(c); 

     for  (int  i = D[c];   i !=  c; i  = D[i])  { 

          O[k]  = i;//record   the  answer. 

          for (int  j  = R[i];  j  != i;  j =  R[j])  { 

              remove(C[j]); 

          } 

          if (dfs(k   + 1))  { 

               return  true; 

          } 

          for  (int  j =  L[i];  j  != i;  j =  L[j])  { 

               resume(C[j]); 

          } 

     } 

     resume(c); 

     return  false; 

函数remove删除了矩阵中的列c及其对应的行。而函数resume则是还原它们,可能有些读者会注意到这两个函数里面顺序的问题。在这里我遵循的原则是先删除的后还原,后删除的先还原。当然,改变其中的某些顺序是不影响正确性的。这样写是为了遵循一定的原则。 

     另外还有一个小问题是我觉得应该提及的。在dfs过程中我们如何选择column  c,是一个非常重要的问题。这个程序中我们选择的是元素最少的c,这个优化是显然的。 

     但如果是平局,我们该选择哪一个呢?在这个程序中,这一点并没有体现出来,如果是平局的话,那这段程序相当于随便选取了一列。这个问题在平时应该用可能会极大的影响效率。只能根据具体题目具体来判定如何解决了。做题的时候如果你发现你写的Dancing  Links比别人的慢一些,那很有可能就是因为这里的问题了。 

3.4    Hust  Online Judge Problem 1017 

     http://acm.hust.edu.cn/thanks/problem.php?id=1017 

     这是一道exact cover problem的一个题目。想测试代码正确性的话可以 

在此提交测试。 

          4    Sudoku to exact cover problem 

4.1    What  is  Sudoku? 

     Sudoku是一个最近几年非常流行的益智游戏。它的中文名是数独。 

     Sudoku问题是在一个9 * 9的格子上,内部有3 * 39个小块。你的目标是把每一个小格填上1-9中的某一个数,使得每一行、每一列、每一个小块都包含1-9每个数各一次。在初始情况下,有一些小格是已经填好了的,你所要做的是把剩下的填好。 

     Sudoku的规则非常简单,但是却很有挑战性。 

     当今众多手机中已经预装了Sudoku游戏。很多linux桌面系统,比如Gnome,也预装了Sudoku。在网上也有很多Sudoku的网站,可以在网上搜索Sudoku来找到一些。今年的ICPC final总决赛的时候,每天的新闻纸背面也是一道数独题。答案在第二天的新闻纸中给出。 

4.2    How to  Solve Sudoku  Puzzle? 

     Sudoku的解法很多,大体上是分为

   *  搜索 

   *  构造 

   *  搜索+构造 

     对于普通的9 * 9Sudoku,最简单的搜索过程是肯定会超时的。我们需要加优化,搜索中比较常用的,优化搜索顺序。在这里可以起到非常关键的作用。 

下面介绍一种搜索策略: 

     每次判断81个小格的可能性,从中选出可能性最少的来搜索。通过位运算等种种优化常数的方法。还是可以达到一个比较理想的效果的。pku3074可以在600ms左右用这种方法ac。 

     我们在这个策略的基础上增加一种搜索方式: 

     判断某个数在某个区域内的可能性。 

     加上这两个搜索方式后,Sudoku就可以比较快的出解了。对于9 * 9Sudoku几乎是瞬出。pku3074可以做到200ms以内。(常数优化的比较好)。 

     对于Sudoku也的构造过程,这里不作过多介绍。Sudoku的构造方法非常多,但大多是人工构造的方法。用计算机去构造,是一个非常繁重的过程, 根本不适合于OIICPC。 

     对于在搜索过程中加上部分构造过程增加效率。这里也不作过多介绍。 方法也是很多,有兴趣的可以去网上查看相关论文。 

     据说今年MCM (美国数学建模竞赛)的B类题目就是Sudoku问题。听我们集训队的yyt说,他们便是写了一个构造Sudoku的程序得了一等奖,不过程序实在是太长了,1k+? 

4.3    Dancing  Links在解决Sudoku这类问题上的优势 

     很多这种覆盖性的搜索问题都可以转化为exact cover problem。然后我们便可以用Dancing Links来解决之。这也是Dancing Links强大的地方。如果你认为Dancing Links只是解决一些特殊问题的特殊方法,那你就大错特错了。非常多问题可以转化成exact cover problem或类似于exact cover  的问题。 

     Dancing Links有什么优势呢? 

   *  Dancing  Links是一种通用的搜索方法,不用你自己去实现搜索过程。不用你对每一道题目都设计数据结构,来设计搜索方法。你所要做的只是去建一个模型。 

   *  Dancing Links不用你自己去想优化搜索的方法。你在建模的和转化的过程中,Dancing Links往往已经为你想好了你都想不到的优化。 

   *  Dancing Links可以减小常数,甚至可以在复杂度上去除一个系数。极大的提高了运行效率。 

   *  Dancing Links代码非常短,方便在比赛现场敲,极大的提高了代码速度。也减少了debug的时间。 

搜索问题千变万化,剪枝非常难想,就算想到了,也很难知道这是不是有用的剪枝。在用Dancing  Links来解决这类问题的时候,你会发现这一类的很多问题都可以转化成你以前熟悉或做过的题目。那剪枝就不再是问题了。因为你已经把剪枝提交想好了。 

     实现也不再是问题了,只要转化正确,再加上Dancing Links的模版。代码正确性和实现速度都有了质的提升。做搜索题就仿佛做网络流题目一样了。 

     建模模版== AC 

     哈哈,是不是很让人心动。那就来看一下如何转化sudoku吧。 

4.4    转化模型 

     对于一个9 * 9的数独,建立如下的矩阵。

     行: 

     一共9 * 9 * 9 == 729行。一共9 * 9小格,每一格有9种可能性(1 - 9),每一种可能都对应着一行。 

     列: 

     一共(9 + 9 + 9) * 9 + 81 == 324 种前面三个9分别代表着99列和9小块。乘以9的意思是9种可能,因为每种可能只可以选择一个。81代表着81个小格,限制着每一个小格只可以放一个地方。 

     这样我们把矩阵建立起来,把行和列对应起来之后,行i可以放在列j上就把A[i][j]设为1否则设为0。然后套用Exact Cover Problem的定义:选择一些行,使得每一列有且仅有一个1。哈哈,是不是对应着sudoku的一个解? 

     前面我已经说过Sudoku的搜索模型,现在再结合转化后的模型,你会不会觉得本质上是一样的呢?其实是一样的。 

     请注意每一列只能有一个1,而且必需有一个1。 

     我们把列分成两类的话,一类是代表着每一个小格的可能性,另一类是代表着每个区域的某个数的可能性。第一类是式子中的81,第二类是(9 + 9 + 9) * 9这一部分。 

     这样我们所选择的行就对应着答案,而且因为列的限制,这个答案也是符合Sudoku的要求的。 

     那你也有可能会说,Dancing Links的优化体现在哪里呢?试想,这个矩阵是非常大的(324 * 729),如果不用Dancing Links来解,可能出解吗? 

4.5    Pku  Online  Judge Problem 3076  3074 

     http://acm.pku.edu.cn/JudgeOnline/problem?id=3074 

     http://acm.pku.edu.cn/JudgeOnline/problem?id=3076 

     3074是一个9 * 9的数独。 

     3076是一个16 * 16的数独。 

     这两道题目用前文论述的方法来解,效率非常高。Problem Status里面前几名的AC Code基本都是用Dancing Links来解的。(不信你发mail问问他们咯)

     3076里面有些人是0ms AC的。而且代码长度非常短,我十分怀疑他们 

是直接交的数据。也希望POJ的管理员能够把数据变一下吧。 

5.1    Abstract 

     了解本节需要知道A*的一些知识。如果你没有做过有关A*的题目,可能在看本节的时候有些困难。因为篇幅,时间和精力都不允许我再去介绍A*。所以我下面所介绍的知识就默认你已经很精通A*啦,不会的集训队队员自己去找资料吧。但是我推荐在你对A*有所了解之后,再回过头来看一下lrj的书对A*在竞赛中应用的介绍。 

     推荐学习A*所要做的题目: 

   *  k短路 

   *  15数码 

   *  k短简单路。 

5.2    Description 

     我们把exact cover problem的定义改一下:在0-1矩阵中选取最少的行,使得每一列最少有一个1。 

     我们可以想成一种二分图的支配集的模型左边的点可以支配右边的点,然后我们要选最少的左边的点,使得右边的点都被支配了。 

     我们用A* + Dancing Links来解决此题。 

     A*是算法的框架,Dancing Links来实现数据结构,和优化常数。 

     A*中比较重要的是h函数的设计,h函数最好设计成离线的,因为计算h函数的复杂度也在很大程度上决定了程序的效率。那h函数如果想不出离线的呢?那我们就应该在保证h函数尽量单调的情况下,来减少计算h函数的常数。 

     因为h函数是与矩阵有关系的,所以对于稀疏的矩阵来说,选择Dancing Links是非常有必要的。随着递归的深入,Dancing Links的优势会体现的越来越明显。 

5.3    H  function 

     对于上节所描述的模型,我设计的h函数是这样的: 

     ans来记录h函数的数值。 

     对当前矩阵来说,选择一个未被控制的列,很明显该列最少需要1个行来控制,所以我把ans++。该列被控制后,我把它所对应的行,全部设为已经选择,并把这些行对应的列也设为被控制。继续选择未被控制的列,直到没有这样的列。 

     通过这样的操作,就可以求出一个粗略的h函数。 

 5.4   Method 

     有了h函数,剩下的就好说了。不管用A*也好,用IDA*也好,实现是比 

较简单的。 

     我的实现方法是IDA*,因为对于一个矩阵进行判重和hash还是比较麻烦的。再加上本题答案都比较小。所以IDA*是一个比较好的选择。 

 5.5   Pku  Online Judge  Problem  1084 

     http://acm.pku.edu.cn/JudgeOnline/problem?id=3076f 

     这道题目也是lrj书上一道习题。题目模型就是我上面所说的。 

     我写的程序实验可以过6 0这样的数据。推荐写个程序来实践一下。 

posted @ 2011-03-15 13:34  Cranny  阅读(9300)  评论(0编辑  收藏  举报