(组合游戏)SG函数与SG定理详解
有一段时间没记录知识类的博客了,这篇博客就说一下SG函数和SG定理吧
SG函数是用于解决博弈论中公平组合游戏(Impartial Combinatorial Games,ICG)问题的一种方法。
什么是组合游戏
在竞赛中,组合游戏的题目一般有以下特点
- 题目描述一般为Alice、Bob 2人做游戏
- Alice、Bob交替进行某种游戏规定的操作,每操作一次,选手可以在有限的操作(操作必须合法)集合中任选一种。
- 对于游戏的任何一种可能的局面,合法的操作集合只取决于这个局面本身,不取决于其它因素(跟选手,以前的所有操作无关)
- 如果当前选手无法进行合法的操作,则为负
举个例子现在有一个数0,小明小红2人每次可以轮流在当前数加 1~3,谁先凑到21谁就赢
这个描述就符合上面的条件:
- 小明小红(满足1)
- 每次轮流在当前数上加1~3(满足2)
- 当前能进行的操作只取决于这个数本身(也就是这个局面),如果这个数为20,可操作的集合为+{1},如果为12,可操作的集合为+{1,2,3}(满足3)
- 如果数字已经为21了,则不可能往上在加数字,可操作集合为
,当前选手为负(满足4)
必胜点和必败点的概念
- 必败点(P点) 前一个(previous player)选手将取胜的点称为必败点
- 必胜点(N点) 下一个(next player)选手将取胜的点称为必胜点
比如现在数字已经为18了,那么当前操作人只要给数字+3则必胜,我们就把在此位置称为必胜点(正常操作情况下,别杠说都18偏要+2。。。。)
必胜点和必败点的性质:
- 所有的终结点都是必败点
- 从任何必胜点操作,至少有一种方式进入必败点
- 无论如何操作, 从必败点都只能进入必胜点.
Sprague-Grundy(SG)定理
游戏和的SG函数
等于各个游戏SG函数的Nim和
。这样就可以将每一个子游戏分而治之,从而简化了问题。而Bouton
定理就是Sprague-Grundy
定理在Nim游戏中的直接应用,因为单堆的Nim游戏 SG函数满足 SG(x) = x。
Nim和 : 各个数相异或的结果
SG函数
先定义mex(minimal excludant)
运算,这是施加于一个集合的运算,表最小的不属于这个集合的非负整数。例如
对于任意状态 x , 定义 SG(x) = mex(S),其中
的终态必然是空集,所以
取石子问题
有1堆n个的石子,每次只能取{ 1, 3, 4 }个石子,先取完石子者胜利,那么各个数的SG值为多少?
SG[0]=0,f[]={1,3,4},
x=1 时,可以取走1 - f{1}个石子,剩余{0}个,所以 SG[1] = mex{ SG[0] }= mex{0} = 1;
x=2 时,可以取走2 - f{1}个石子,剩余{1}个,所以 SG[2] = mex{ SG[1] }= mex{1} = 0;
x=3 时,可以取走3 - f{1,3}个石子,剩余{2,0}个,所以 SG[3] = mex{SG[2],SG[0]} = mex{0,0} =1;
x=4 时,可以取走4- f{1,3,4}个石子,剩余{3,1,0}个,所以 SG[4] = mex{SG[3],SG[1],SG[0]} = mex{1,1,0} = 2;
x=5 时,可以取走5 - f{1,3,4}个石子,剩余{4,2,1}个,所以SG[5] = mex{SG[4],SG[2],SG[1]} =mex{2,0,1} = 3;
以此类推…
x 0 1 2 3 4 5 6 7 8…
SG[x] 0 1 0 1 2 3 2 0 1…
由上述实例我们就可以得到SG函数值求解步骤,那么计算1~n的SG函数值步骤如下:
1、使用 数组f 将 可改变当前状态 的方式记录下来。
2、然后我们使用 另一个数组 将当前状态x 的后继状态标记。
3、最后模拟mex运算,也就是我们在标记值中 搜索 未被标记值 的最小值,将其赋值给SG(x)。
4、我们不断的重复 2 - 3 的步骤,就完成了 计算1~n 的函数值。
模板如下:
//f[N]:可改变当前状态的方式,N为方式的种类,f[N]要在getSG之前先预处理
//SG[]:0~n的SG函数值
//S[]:为x后继状态的集合
int f[N],SG[MAXN],S[MAXN];
void getSG(int n){
int i,j;
memset(SG,0,sizeof(SG));
//因为SG[0]始终等于0,所以i从1开始
for(i = 1; i <= n; i++){
//每一次都要将上一状态 的 后继集合 重置
memset(S,0,sizeof(S));
for(j = 0; f[j] <= i && j <= N; j++)
S[SG[i-f[j]]] = 1; //将后继状态的SG函数值进行标记
for(j = 0;; j++) if(!S[j]){ //查询当前后继状态SG值中最小的非零值
SG[i] = j;
break;
}
}
}
其实不难发现,Nim游戏就是一个很典型的用SG定理解决的问题,因为Nim游戏在一堆n个石子中可以取1-n个石子,所以单独这一堆石子的SG值为
20.11.4 update:
另一个石头问题
([洛谷P2148)SDOI2009]E&D
小 E 与小 W 进行一项名为
E&D
游戏。游戏的规则如下:桌子上有
堆石子,编号为 。其中,为了方便起见,我们将第 堆与第 堆( )视为同一组。第 堆的石子个数用一个正整数 表示。 一次分割操作指的是,从桌子上任取一堆石子,将其移走。然后分割它同一组的另一堆石子,从中取出若干个石子放在被移走的位置,组成新的一堆。操作完成后,所有堆的石子数必须保证大于
。显然,被分割的一堆的石子数至少要为 。两个人轮流进行分割操作。如果轮到某人进行操作时,所有堆的石子数均为 ,则此时没有石子可以操作,判此人输掉比赛。 小 E 进行第一次分割。他想知道,是否存在某种策略使得他一定能战胜小 W。因此,他求助于小 F,也就是你,请你告诉他是否存在必胜策略。例如,假设初始时桌子上有
堆石子,数量分别为 。小 E 可以选择移走第 1 堆,然后将第 2 堆分割(只能分出 1 个石子)。接下来,小 W 只能选择移走第 4 堆,然后将第 3 堆分割为 1 和 2。最后轮到小 E,他只能移走后两堆中数量为 1 的一堆,将另一堆分割为 1 和 1。这样,轮到小 W 时,所有堆的数量均为 1,则他输掉了比赛。故小 E 存在必胜策略。
很显然这是一个ICG,且可以看作
这张表显然很有规律,例如当
总结成公式就是:当
。于是可以递归求解,代码如下:
// Author : RioTian
// Time : 20/11/04
#include <bits/stdc++.h>
using namespace std;
typedef long long ll;
int count(ll n) {
int cnt = 0;
while (n % 2 == 0) n /= 2, cnt++;
return cnt;
}
int sg(ll a, ll b) {
if (a % 2 && b % 2)
return 0;
else if (a % 2 == 0)
return sg(a / 2, (b - 1) / 2 + 1) + 1;
else
return sg(b, a);
}
int main() {
// freopen("in.txt", "r", stdin);
ios::sync_with_stdio(false), cin.tie(0), cout.tie(0);
ll t, x, y, n;
cin >> t;
while (t--) {
int res = 0;
cin >> n;
for (int i = 0; i < n / 2; ++i) cin >> x >> y, res ^= sg(x, y);
cout << (res ? "YES\n" : "NO\n");
}
}
我们并没有严格地证明观察出结论,但这就是这类题的通常做法:打表找规律。严格证明需要花的时间,对ACM来说太奢侈了。以下这个mex
函数可能会经常用于打表:
int mex(auto v) { // v可以是vector、set等容器
unordered_set<int> S;
for (auto e : v) S.insert(e);
for (int i = 0;; ++i)
if (S.find(i) == S.end()) return i;
}
本文是参考其他博文+自己理解,整理而来,现附上参考博文链接:
https://blog.csdn.net/luomingjun12315/article/details/45555495
· 探究高空视频全景AR技术的实现原理
· 理解Rust引用及其生命周期标识(上)
· 浏览器原生「磁吸」效果!Anchor Positioning 锚点定位神器解析
· 没有源码,如何修改代码逻辑?
· 一个奇形怪状的面试题:Bean中的CHM要不要加volatile?
· Obsidian + DeepSeek:免费 AI 助力你的知识管理,让你的笔记飞起来!
· 分享4款.NET开源、免费、实用的商城系统
· 解决跨域问题的这6种方案,真香!
· 一套基于 Material Design 规范实现的 Blazor 和 Razor 通用组件库
· 5. Nginx 负载均衡配置案例(附有详细截图说明++)