(组合游戏)SG函数与SG定理详解
有一段时间没记录知识类的博客了,这篇博客就说一下SG函数和SG定理吧
SG函数是用于解决博弈论中公平组合游戏(Impartial Combinatorial Games,ICG)问题的一种方法。
什么是组合游戏
在竞赛中,组合游戏的题目一般有以下特点
- 题目描述一般为Alice、Bob 2人做游戏
- Alice、Bob交替进行某种游戏规定的操作,每操作一次,选手可以在有限的操作(操作必须合法)集合中任选一种。
- 对于游戏的任何一种可能的局面,合法的操作集合只取决于这个局面本身,不取决于其它因素(跟选手,以前的所有操作无关)
- 如果当前选手无法进行合法的操作,则为负
举个例子现在有一个数0,小明小红2人每次可以轮流在当前数加 1~3,谁先凑到21谁就赢
这个描述就符合上面的条件:
- 小明小红(满足1)
- 每次轮流在当前数上加1~3(满足2)
- 当前能进行的操作只取决于这个数本身(也就是这个局面),如果这个数为20,可操作的集合为+{1},如果为12,可操作的集合为+{1,2,3}(满足3)
- 如果数字已经为21了,则不可能往上在加数字,可操作集合为\(Φ\),当前选手为负(满足4)
必胜点和必败点的概念
- 必败点(P点) 前一个(previous player)选手将取胜的点称为必败点
- 必胜点(N点) 下一个(next player)选手将取胜的点称为必胜点
比如现在数字已经为18了,那么当前操作人只要给数字+3则必胜,我们就把在此位置称为必胜点(正常操作情况下,别杠说都18偏要+2。。。。)
必胜点和必败点的性质:
- 所有的终结点都是必败点
- 从任何必胜点操作,至少有一种方式进入必败点
- 无论如何操作, 从必败点都只能进入必胜点.
Sprague-Grundy(SG)定理
游戏和的SG函数
等于各个游戏SG函数的Nim和
。这样就可以将每一个子游戏分而治之,从而简化了问题。而Bouton
定理就是Sprague-Grundy
定理在Nim游戏中的直接应用,因为单堆的Nim游戏 SG函数满足 SG(x) = x。
Nim和 : 各个数相异或的结果
SG函数
先定义mex(minimal excludant)
运算,这是施加于一个集合的运算,表最小的不属于这个集合的非负整数。例如\(mex\{0,1,2,4\}=3、mex\{2,3,5\}=0、mex\{\}=0\)。
对于任意状态 x , 定义 SG(x) = mex(S),其中 \(S\) 是 \(x\) 后继状态的 \(SG\)函数值的集合。如 x 有三个后继状态分别为 \(SG(a),SG(b),SG(c)\) ,那么 \(SG(x) = mex\{SG(a,SG(b),SG(c)\}\) 。这样集合 \(S\) 的
的终态必然是空集,所以\(SG\) 函数的终态为 \(SG(x) = 0\) ,当且仅当x 为必败点P时
取石子问题
有1堆n个的石子,每次只能取{ 1, 3, 4 }个石子,先取完石子者胜利,那么各个数的SG值为多少?
SG[0]=0,f[]={1,3,4},
x=1 时,可以取走1 - f{1}个石子,剩余{0}个,所以 SG[1] = mex{ SG[0] }= mex{0} = 1;
x=2 时,可以取走2 - f{1}个石子,剩余{1}个,所以 SG[2] = mex{ SG[1] }= mex{1} = 0;
x=3 时,可以取走3 - f{1,3}个石子,剩余{2,0}个,所以 SG[3] = mex{SG[2],SG[0]} = mex{0,0} =1;
x=4 时,可以取走4- f{1,3,4}个石子,剩余{3,1,0}个,所以 SG[4] = mex{SG[3],SG[1],SG[0]} = mex{1,1,0} = 2;
x=5 时,可以取走5 - f{1,3,4}个石子,剩余{4,2,1}个,所以SG[5] = mex{SG[4],SG[2],SG[1]} =mex{2,0,1} = 3;
以此类推…
x 0 1 2 3 4 5 6 7 8…
SG[x] 0 1 0 1 2 3 2 0 1…
由上述实例我们就可以得到SG函数值求解步骤,那么计算1~n的SG函数值步骤如下:
1、使用 数组f 将 可改变当前状态 的方式记录下来。
2、然后我们使用 另一个数组 将当前状态x 的后继状态标记。
3、最后模拟mex运算,也就是我们在标记值中 搜索 未被标记值 的最小值,将其赋值给SG(x)。
4、我们不断的重复 2 - 3 的步骤,就完成了 计算1~n 的函数值。
模板如下:
//f[N]:可改变当前状态的方式,N为方式的种类,f[N]要在getSG之前先预处理
//SG[]:0~n的SG函数值
//S[]:为x后继状态的集合
int f[N],SG[MAXN],S[MAXN];
void getSG(int n){
int i,j;
memset(SG,0,sizeof(SG));
//因为SG[0]始终等于0,所以i从1开始
for(i = 1; i <= n; i++){
//每一次都要将上一状态 的 后继集合 重置
memset(S,0,sizeof(S));
for(j = 0; f[j] <= i && j <= N; j++)
S[SG[i-f[j]]] = 1; //将后继状态的SG函数值进行标记
for(j = 0;; j++) if(!S[j]){ //查询当前后继状态SG值中最小的非零值
SG[i] = j;
break;
}
}
}
其实不难发现,Nim游戏就是一个很典型的用SG定理解决的问题,因为Nim游戏在一堆n个石子中可以取1-n个石子,所以单独这一堆石子的SG值为\(mex(n−1,n−2,n−3,...,n−n)=n\),根据SG定理,每一堆石子总数相互异或即为答案
20.11.4 update:
另一个石头问题
([洛谷P2148)SDOI2009]E&D
小 E 与小 W 进行一项名为
E&D
游戏。游戏的规则如下:桌子上有 \(2n\) 堆石子,编号为 \(1∼2n\)。其中,为了方便起见,我们将第 \(2k-1\) 堆与第 \(2k\) 堆(\(1≤k≤n\))视为同一组。第 \(i\) 堆的石子个数用一个正整数 \(S_i\)表示。
一次分割操作指的是,从桌子上任取一堆石子,将其移走。然后分割它同一组的另一堆石子,从中取出若干个石子放在被移走的位置,组成新的一堆。操作完成后,所有堆的石子数必须保证大于 \(0\)。显然,被分割的一堆的石子数至少要为 \(2\)。两个人轮流进行分割操作。如果轮到某人进行操作时,所有堆的石子数均为 \(1\),则此时没有石子可以操作,判此人输掉比赛。
小 E 进行第一次分割。他想知道,是否存在某种策略使得他一定能战胜小 W。因此,他求助于小 F,也就是你,请你告诉他是否存在必胜策略。例如,假设初始时桌子上有 \(4\) 堆石子,数量分别为\(1,2,3,1\)。小 E 可以选择移走第 1 堆,然后将第 2 堆分割(只能分出 1 个石子)。接下来,小 W 只能选择移走第 4 堆,然后将第 3 堆分割为 1 和 2。最后轮到小 E,他只能移走后两堆中数量为 1 的一堆,将另一堆分割为 1 和 1。这样,轮到小 W 时,所有堆的数量均为 1,则他输掉了比赛。故小 E 存在必胜策略。
很显然这是一个ICG,且可以看作 \(n\) 个子游戏的组合,显然每一组两堆石子组成最小单位。我们直接打表列出值\(SG\)(按照定义计算,可以写程序或手算)
这张表显然很有规律,例如当 \(a\) 和 \(b\) 是奇数时 \(s(a,b) = 0\) ,还有 \(sg(i,j) = sg(j,i)\),等等。还很容易发现,偶数列(或行)都是几个几个一组的。在此基础上进一步观察,可以发现第 \(2n\) 列的值与第 \(n\) 列是有关联的。
总结成公式就是:当 \(a\) 为偶数时,
。于是可以递归求解,代码如下:
// Author : RioTian
// Time : 20/11/04
#include <bits/stdc++.h>
using namespace std;
typedef long long ll;
int count(ll n) {
int cnt = 0;
while (n % 2 == 0) n /= 2, cnt++;
return cnt;
}
int sg(ll a, ll b) {
if (a % 2 && b % 2)
return 0;
else if (a % 2 == 0)
return sg(a / 2, (b - 1) / 2 + 1) + 1;
else
return sg(b, a);
}
int main() {
// freopen("in.txt", "r", stdin);
ios::sync_with_stdio(false), cin.tie(0), cout.tie(0);
ll t, x, y, n;
cin >> t;
while (t--) {
int res = 0;
cin >> n;
for (int i = 0; i < n / 2; ++i) cin >> x >> y, res ^= sg(x, y);
cout << (res ? "YES\n" : "NO\n");
}
}
我们并没有严格地证明观察出结论,但这就是这类题的通常做法:打表找规律。严格证明需要花的时间,对ACM来说太奢侈了。以下这个mex
函数可能会经常用于打表:
int mex(auto v) { // v可以是vector、set等容器
unordered_set<int> S;
for (auto e : v) S.insert(e);
for (int i = 0;; ++i)
if (S.find(i) == S.end()) return i;
}
本文是参考其他博文+自己理解,整理而来,现附上参考博文链接:
https://blog.csdn.net/luomingjun12315/article/details/45555495