吴昊品游戏核心算法(新年特别篇)—— m堆级别的取石子游戏(尼姆博弈)(HDOJ 2176)

 

好啦,我这里再摆出一堆石子,不过,这次的问题规模由2堆变成了m堆,方法也会换去,但是“必胜点”和“必败点”的思想还是可以保留住的。这里,每次可以在其中一堆取任意数目的石子,就是不能不取。当然,还是本人先走。

  尼姆博弈基本思想:

   两人从n堆物品中取任意个,先取完者胜。

   即将n堆物品的数量异或,得到的值如果为0,则先手败,反之先手胜。

   如果要求先手在胜的条件下,到奇异局势的方法数,则判断异或的值与每一堆原值异或后(结果应该表示该堆没有参加异或时的异或值)与原值比较大小,

   如果小于,则方法数加一。且对应的方法后,该堆的数目应变为异或的值与每一堆原值异或的值。

   尼姆博弈的原理:

  定 义P-position和N-position,其中P代表Previous,N代表Next。直观的说,上一次move的人有必胜策略的局面是P- position,也就是“后手可保证必胜”或者“先手必败”,现在轮到move的人有必胜策略的局面是N-position,也就是“先手可保证必 胜”。更严谨的定义是:1.无法进行任何移动的局面(也就是terminal position)是P-position;2.可以移动到P-position的局面是N-position;3.所有移动都导致N-position 的局面是P-position。

按照这个定义,如果局面不可能重现,或者说positions的集合可以进行拓扑排序,那么每个position或者是P-position或者是N-position,而且可以通过定义计算出来。

以 Nim游戏为例来进行一下计算。比如说我刚才说当只有两堆石子且两堆石子数量相等时后手有必胜策略,也就是这是一个P-position,下面我们依靠定 义证明一下(3,3)是一个P是一个P是一个P-position。首先(3,3)的子局面(也就是通过合法移动可以导致的局面)有(0,3) (1,3)(2,3)(显然交换石子堆的位置不影响其性质,所以把(x,y)和(y,x)看成同一种局面),只需要计算出这三种局面的性质就可以了。 (0,3)的子局面有(0,0)、(0,1)、(0,2),其中(0,0)显然是P-position,所以(0,3)是N-position(只要找到 一个是P-position的子局面就能说明是N-position)。(1,3)的后继中(1,1)是P-position(因为(1,1)的唯一子局 面(0,1)是N-position),所以(1,3)也是N-position。同样可以证明(2,3)是N-position。所以(3,3)的所有 子局面都是N-position,它就是P-position。通过一点简单的数学归纳,可以严格的证明“有两堆石子时的局面是P-position当且 仅当这两堆石子的数目相等”。

根 据上面这个过程,可以得到一个递归的算法——对于当前的局面,递归计算它的所有子局面的性质,如果存在某个子局面是P-position,那么向这个子局 面的移动就是必胜策略。当然,可能你已经敏锐地看出有大量的重叠子问题,所以可以用DP或者记忆化搜索的方法以提高效率。但问题是,利用这个算法,对于某 个Nim游戏的局面(a1,a2,...,an)来说,要想判断它的性质以及找出必胜策略,需要计算O(a1*a2*...*an)个局面的性质,不管怎 样记忆化都无法降低这个时间复杂度。所以我们需要更高效的判断Nim游戏的局面的性质的方法。

直 接说结论好了。(Bouton's Theorem)对于一个Nim游戏的局面(a1,a2,...,an),它是P-position当且仅当a1^a2^...^an=0,其中^表示异 或(xor)运算。怎么样,是不是很神奇?我看到它的时候也觉得很神奇,完全没有道理的和异或运算扯上了关系。但这个定理的证明却也不复杂,基本上就是按 照两种position的证明来的。

根 据定义,证明一种判断position的性质的方法的正确性,只需证明三个命题: 1、这个判断将所有terminal position判为P-position;2、根据这个判断被判为N-position的局面一定可以移动到某个P-position;3、根据这个判 断被判为P-position的局面无法移动到某个P-position。

第一个命题显然,terminal position只有一个,就是全0,异或仍然是0。

第 二个命题,对于某个局面(a1,a2,...,an),若a1^a2^...^an!=0,一定存在某个合法的移动,将ai改变成ai'后满足 a1^a2^...^ai'^...^an=0。不妨设a1^a2^...^an=k,则一定存在某个ai,它的二进制表示在k的最高位上是1(否则k的 最高位那个1是怎么得到的)。这时ai^k<ai一定成立。则我们可以将ai改变成ai'=ai^k,此时 a1^a2^...^ai'^...^an=a1^a2^...^an^k=0。

第 三个命题,对于某个局面(a1,a2,...,an),若a1^a2^...^an=0,一定不存在某个合法的移动,将ai改变成ai'后满足 a1^a2^...^ai'^...^an=0。因为异或运算满足消去率,由a1^a2^...^an=a1^a2^...^ai'^...^an可以得 到ai=ai'。所以将ai改变成ai'不是一个合法的移动。证毕。

根据这个定理,我们可以在O(n)的时间内判断一个Nim的局面的性质,且如果它是N-position,也可以在O(n)的时间内找到所有的必胜策略。Nim问题就这样基本上完美的解决了。

  Source:HDOJ 2176

 

 1  #include<cstdio>
 2  using namespace std;
 3 
 4  //假设最多200000堆
 5  const int N = 200002;
 6 
 7  int n, a[N];
 8 
 9  void Solve()
10  {
11    int ind, tmp;
12    //这里相当于遇到0的时候就退出
13    while(scanf("%d", &n), n)
14    {
15      scanf("%d", &a[0]);
16      ind = a[0];
17      //取原值与其做异或
18      for(int i = 1; i < n; ++i)
19      {
20        scanf("%d", a + i);
21        ind ^= a[i];
22      }
23      //这样写,也是会了防止将其误认为是赋值语句而写成了ind=0
24      if(0 == ind)
25      {
26        puts("No");
27        continue;
28      }
29      puts("Yes");
30      for(int i = 0; i < n; ++i)
31      {
32        //考虑第一次取的情况,做异或之后,其新值应该比原值要小,如果从第i堆里面取走(a[i]-tmp)个会胜利的话,就输出
33        tmp = ind ^ a[i];
34        if(tmp < a[i])
35        {
36          printf("%d %d\n", a[i], tmp);
37        }
38      }
39    }
40    return;
41  }
42 
43  int main()
44  {
45    Solve();
46    return 0;
47  }
48 
49 

 

posted on 2013-02-27 23:00  吴昊系列  阅读(306)  评论(0编辑  收藏  举报

导航