博弈
参考资料:
[1]:https://blog.csdn.net/acm_cxlove/article/details/7854526
[2]:博弈总结
(一)巴什博奕(Bash Game)
只有一堆n个物品,两个人轮流从这堆物品中取物,规定每次至少取一个,最多取m个。最后取光者得胜。
显然,如果n=m+1,那么由于一次最多只能取m个,所以,无论先取者拿走多少个,后取者都能够一次拿走剩余的物品,后者取胜。
因此我们发现了如何取胜的法则:
令 n=(m+1)*r+s,(r为任意自然数,s ≤ m);
如果 s > 0,那么先取者要拿走s个物品,如果后取者拿走k(≤m)个,那么先取者再拿走 m+1-k 个,结果剩下 (m+1)*(r-1)个;
以后保持这样的取法,那么先取者肯定获胜。
反之,如果 s == 0,那么后取者肯定获胜。
总之,要保持给对手留下(m+1)的倍数,就能最后获胜。
这个游戏还可以有一些变相的玩法:
1)两个人轮流报数,每次至少报一个,最多报十个,谁能报到100者胜。
2)有二十杯水,其中确定有一杯含有毒药,两个人轮流喝,最少喝一杯,最多喝三杯,谁会喝到有毒的水?
(二)威佐夫博奕(Wythoff Game)
有两堆各若干个物品,两个人轮流从某一堆或同时从两堆中取同样多的物品,规定每次至少取一个,多者不限,最后取光者得胜。
这种情况下是颇为复杂的。我们用(ak,bk)(ak ≤ bk ,k=0,1,2,…,n)表示两堆物品的数量并称其为局势;
如果甲面对(0,0),那么甲已经输了,这种局势我们称为奇异局势。
前几个奇异局势是:(0,0)、(1,2)、(3,5)、(4,7)、(6,10)、(8,13)、(9,15)、(11,18)、(12,20)。
可以看出,a0=b0=0,ak是未在前面出现过的最小自然数,而 bk= ak + k,奇异局势有如下三条性质:
- 任何自然数都包含在一个且仅有一个奇异局势中。
- 任意操作都可将奇异局势变为非奇异局势。
- 采用适当的方法,可以将非奇异局势变为奇异局势。
性质1证明:
由于ak是未在前面出现过的最小自然数,所以有ak > ak-1 ,而 bk= ak + k > ak-1 + k-1 = bk-1 > ak-1 。
所以性质1成立。
性质2证明:
事实上,若只改变奇异局势(ak,bk)的某一个分量,那么另一个分量不可能在其他奇异局势中,所以必然是非奇异局势。
如果使(ak,bk)的两个分量同时减少,则由于其差不变,且不可能是其他奇异局势的差,因此也是非奇异局势。
性质3证明:
假设面对的局势是(a,b),且满足 a ≤ b;
①若 b = a,则同时从两堆中取走 a 个物体,就变为了奇异局势(0,0);
②若 a = ak ,b > bk,那么,从 b 中取走b – bk个物体,即变为奇异局势;
③若 a = ak ,b < bk,假设奇异局势差 bj - aj = b-a,那么,从a,b两堆中同时取走 a-aj 个物体就变成了奇异局势(aj,bj);
④若 a > ak ,b = ak + k,则从第一堆中拿走多余的数量a – ak 即可;
⑤若 a < ak ,b= ak + k,分两种情况;
第一种,a = aj (j < k),从第二堆里面拿走 b – bj 即可;
第二种,a = bj (j < k),从第二堆里面拿走 b – aj 即可。
从如上性质可知,两个人如果都采用正确操作,那么面对非奇异局势,先拿者必胜;
反之,则后拿者取胜。
那么任给一个局势(a,b),且 a ≤ b,怎样判断它是不是奇异局势呢?
我们有如下公式:
如果 (int)(b-a)*( (1+sqrt(5) ) / 2 ) == a ,那么此局势就是奇异局势,后手必胜;
反之,先手必胜。
而 (sqrt(5)+1) / 2 = 1.618 ;
大家都知道0.618是黄金分割率。
而威佐夫博弈正好是1.618,这就是博弈的奇妙之处!
(三)尼姆博奕(Nimm Game):
有三堆各若干个物品,两个人轮流从某一堆取任意多的物品,规定每次至少取一个,多者不限,最后取光者得胜。
这种情况最有意思,它与二进制有密切关系,我们用(a,b,c)表示某种局势,首先(0,0,0)显然是奇异局势,无论谁面对奇异局势,都必然失败。
第二种奇异局势是(0,n,n),只要与对手拿走一样多的物品,最后都将导致(0,0,0)。
仔细分析一下,(1,2,3)也是奇异局势,无论对手如何拿,接下来都可以变为(0,n,n)的情形。
计算机算法里面有一种叫做“按位模2加”,也叫做异或的运算,我们用符号 xor 表示这种运算。
这种运算和一般加法不同的一点是 1+1=0。
先看(1,2,3)的按位模2加的结果:
1 = 01(2)
2 = 10(2)
3 = 11(2) xor
———————
0 = 00(2) (注意不进位)
对于奇异局势(0,n,n)也一样,结果也是0。
任何奇异局势(a,b,c)都有a xor b xor c = 0。
如果我们面对的是一个非奇异局势(a,b,c),要如何变为奇异局势呢?
假设 a < b< c;
1)如果 a ≥ b xor c ,令 a = b xor c,那么奇异局势就是 ( b xor c , b , c);
2)如果 b ≥ a xor c ,令 b = a xor c,那么奇异局势就是 ( a , a xor c , c);
3)如果 c ≥ a xor b ,令 c = a xor b,那么奇异局势就是 ( a , b , a xor b);
取火柴的游戏
题目1:今有若干堆火柴,两人依次从中拿取,规定每次只能从一堆中取若干根, 可将一堆全取走,但不可不取;
最后取完者为胜,求必胜的方法。
题目2:今有若干堆火柴,两人依次从中拿取,规定每次只能从一堆中取若干根, 可将一堆全取走,但不可不取;
最后取完者为负,求必胜的方法。
先解决第一个问题吧。
定义:若所有火柴数异或为0,则该状态被称为利他态,用字母T表示,否则, 为利己态,用S表示。
简言之,T态为奇异局势,S态为非奇异局势;
[定理1]:对于任何一个S态,总能从一堆火柴中取出若干个使之成为T态。
证明: 若有n堆火柴,每堆火柴有A(i)根火柴数,那么既然现在处于S态, c = A(1) xor A(2) xor … xor A(n) > 0; 把c表示成二进制,记它的二进制数的最高位为第p位,则必然存在一个A(t), 它二进制的第p位也是1。 (否则,若所有的A(i)的第p位都是0,这与 c 的第p位为 1 矛盾)。 那么我们令 x = A(t) xor c,则得到 x < A(t). 这是因为既然 A(t) 的第p位与 c 的第p位同为1,那么 x 的第p位变为0, 而高于 p 的位并没有改变。 所以x < A(t);而 A(1) xor A(2) xor … xor (x) xor … xor A(n) = A(1) xor A(2) xor … xor (A(t) xor c) xor … xor A(n) = A(1) xor A(2) xor… xor A(n) xor c = 0 这就是说从A(t)堆中取出 A(t) – x 根火柴后状态就会从S态变为T态。证
[定理 2]:T态,取任何一堆的若干根,都将成为S态。
[定理 3]:S态,只要方法正确,先手必赢。
最终胜利即由S态转变为T态,任何一个S态,只要把它变为T态,(由定理1,可以把它变成T态)对方只能把T态转变为S态(定理2)。
这样,所有S态向T态的转变都可以有己方控制,对方只能被动地实现由T态转变为S态。故S态必赢。
[定理 4]:T态,只要对方法正确,先手必败。
接着来解决第二个问题。
定义:若一堆中仅有1根火柴,则被称为孤单堆。若大于1根,则称为充裕堆。
定义:T态中,若充裕堆的堆数大于等于2,则称为完全利他态,用T2表示;
若充裕堆的堆数等于0,则称为部分利他态,用T0表示。
定义:S态中,S0表示充裕堆的堆数等于0;
S1表示充裕堆的堆数等于1;
S2表示充裕堆的堆数大于等于2;
孤单堆的根数异或只会影响二进制的最后一位,但充裕堆会影响高位(非最后一位)。
如果只有一个充裕堆,高位必有一位不为0,则所有根数异或不为0。故仅有一个充裕堆不会是T态。
[定理5]:S0态,必败。T0态必胜。
证明:
S0态,其实就是有奇数堆,每堆仅有一根火柴。
每次第奇数根都由己取,第偶数根都由对 方取;
所以最后一根必己取。
先手必败。
同理, T0态先手必胜。
[定理6]:S1态,只要方法正确,必胜。
证明:
若此时孤单堆堆数为奇数,把充裕堆取完;
否则,取成一根。这样,就变成奇数个孤单堆,由对方取。
由定理5,后手必输。
[定理7]:S2态不可转一次变为T0态。
证明:
充裕堆数不可能一次由2变为0。得证。
[定理8]:S2态可一次转变为T2态。
证明:
由定理1,S态可转变为T态,故S2态可一次转变为T态,又由定理7,S2态不可转一次变为T0态,所以转变的T态为T2态。
[定理9]:T2态,只能转变为S2态或S1态。
证明:
由定理2,T态必然变为S态。由于充裕堆数不可能一次由2变为0,所以此时的S态不可能为S0态。命题得证。
[定理10]:S2态,只要方法正确,必胜.
证明: 方法如下: 1)S2态,就把它变为T2态。(由定理8) 2)对方只能由T2转变成S2态或S1态(定理9) 若转变为S2, 转向1) 若转变为S1, 先手必胜(定理5)
[定理11]:T2态必输。
证明:同定理10。
综上所述,必输态有:T2,S0
必胜态有:S2,S1,T0.