组合游戏与博弈论基础

基本定义

策梅洛定理（Zermelo's theorem）

在二人的有限游戏中，如果双方皆拥有完全的资讯，并且运气因素并不牵涉在游戏中，那先行或后行者当一必有一方有必胜/必不败的策略。

即对于游戏局面 $X$ ，存在确定的游戏结果 $P (X) = 0 o r 1$ ， $s u c c (X)$ 为 $X$ 的后继局面。

推论

一个状态是必败状态，当且仅当，它的所有后继状态都是必胜状态
$P (X) = 0 ⟺ \forall i, P (s u c c (X_{i})) = 1$
一个状态是必胜状态，当且仅当，它的至少一个后继状态是必败状态
$P (X) = 1 ⟺ \exists i, P (s u c c (X_{i})) = 0$

SG游戏

SG游戏定义：没有后继状态为必败状态
$s u c c (X) = \emptyset \Rightarrow P (X) = 0$

NIM游戏

桌上n堆石子，游戏者轮流在某一堆取若干(>0)个，取走最后一个石子人胜。
最后局面为
$X_{e n d} = {X_{1} = 0, X_{2} = 0, \dots, X_{n} = 0}$
可知NIM游戏是SG游戏。

Bouton定理

在NIM游戏中的必胜状态为：当前局面下所有单堆石子数目的异或和不为0
$P (X) = ((x_{1} \oplus x_{2} \oplus \dots \oplus x_{n}) \neq 0)$

单堆NIM游戏

SG函数（定义见下）
$S G (x) = x$
游戏结果
$P (x) = {\begin{cases} 0 & x = 0 \\ 1 & o t h e r w i s e \end{cases}$

SG函数

一个游戏局面的SG函数为该局面的后继局面的SG函数集合的mex值
$S G (X) = m e x (S)$
其中
$S = {S G (s u c c (X_{1})), S G (s u c c (X_{2})), \dots S G (s u c c (X_{n}))}$
mex表示不在集合内的最小非负整数
$m e x (S) = m i n (x | (x \in R) & (x \notin S))$

Sprague-Grundy 定理

游戏和的SG函数等于各子游戏SG函数的NIM和
$S G (X) = S G (X_{1}) \oplus S G (X_{2}) \oplus \dots \oplus S G (X_{n})$
其中
SG游戏局面为若干SG子游戏之和
$X = X_{1} + X_{2} + \dots + X_{n}$

SG函数性质

$S G (X) = 0 ⟺ \forall i, S G (s u c c (X_{i})) \neq 0$
2.
$S G (X) \neq 0 ⟺ \exists i, S G (s u c c (X_{i})) = 0$
3.
$s u c c (X) = \emptyset \Rightarrow S G (X) = 0$

在SG游戏（ $s u c c (X) = \emptyset \Rightarrow P (X) = 0$ ）条件下的等价结论

$P (X) = 0 ⟺ S G (X) = 0$
$P (X) = 1 ⟺ S G (X) \neq 0$

反SG(Anti-SG)游戏

Anti-SG游戏定义：决策集合为空的为必胜状态
$s u c c (X) = \emptyset \Rightarrow P (X) = 1$

反NIM (Anti-NIM)游戏

桌上n堆石子，游戏者轮流在某一堆取若干(>0)个，取走最后一个石子人败。

单堆反NIM游戏

SG函数:不变
$S G (x) = x$
游戏结果:判断标准改变
$P (x) = {\begin{cases} 0 & x = 1 \\ 1 & o t h e r w i s e \end{cases}$
解释：

若堆中有1个石子，根据定义，为必败状态。
若堆中有0个石子，根据定义，为必胜状态。
若堆中石子数目大于1，存在导致必败状态的取法：取剩下1个石子，因此为必胜状态。

反NIM游戏的游戏结果

$P (X) = {\begin{cases} S G (X) = 0 & \forall i, x_{i} = 1 \\ S G (X) \neq 0 & o t h e r w i s e \end{cases}$

Sprague Grundy——Jia Zhihao 定理

对于任意一个 Anti-SG 游戏，如果我们规定当局面中所有的单一游戏的 SG 值为 0 时，游戏结束，则先手必胜当且仅当：

游戏的 SG 函数不为 0 且游戏中某个单一游戏的 SG 函数大于 1；
游戏的 SG 函数为 0 且游戏中没有单一游戏的 SG 函数大于 1。
即，在Anti-SG游戏（ $s u c c (X) = \emptyset \Rightarrow P (X) = 1$ ）条件下的等价结论
$P (X) = {\begin{cases} S G (X) = 0 & \forall i, S G (X_{i}) \leq 1 \\ S G (X) \neq 0 & \exists i, S G (X_{i}) > 1 \end{cases}$

引论

“规定当局面中所有的单一游戏的 SG 值为 0 时，游戏结束”过于严格，完全可以替换成“当局面中所有的单一游戏的 SG 值为 0 时，存在一个单一游戏它的 SG 函数能通过一次操作变为 1”。
$(\forall i, S G (X_{i}) = 0) & (\exists i, S G (s u c c (X_{i})) = 1) \Rightarrow P (X) = 1$

SG游戏和反SG游戏模型

除了上述提到的NIM游戏和反NIM游戏，还存在几类博弈论组合游戏中的经典变体。

巴什博弈（Bash game）

有一堆总数为n的物品，2名玩家轮流从中拿取物品。每次至少拿1件，至多拿m件，不能不拿，最终将物品拿完者获胜。
（单堆NIM游戏变式-有上限的单堆NIM游戏）

巴什博弈游戏结果

在先取完者胜的巴什博弈中，若n可被m+1整除，则先手必败，否则先手必胜。
$P (n) = ((n % (m + 1)) \neq 0)$

反巴什博弈（Anti-Bash game）游戏结果

在先取完者败的反巴什博弈中，若n整除m+1的余数为1则先手必败，否则先手必胜。
$P (n) = ((n % (m + 1)) \neq 1)$

威佐夫博弈（Wythoff's game）

有两堆各若干个物品，两个人轮流从任一堆取至少一个或同时从两堆中取同样多的物品，规定每次至少取一个，多者不限，最后取光者得胜。

奇异局势

$X = (a [k] ， b [k]), k \in R, P (X) = 0$
$a [0] = b [0] = 0$ , $a [k]$ 是未在前面出现过的最小自然数，即 $m e x ({a [0], a [1], \dots, a [k - 1], b [0], b [1], \dots, b [k - 1]})$ ,而 $b [k] = a [k] + k$ 。

Betty 定理（Betti theorem）

设 $a$ 、 $b$ 是正无理数且 $\frac{1}{a} + \frac{1}{b} = 1$ 。记 $P = {⌊ n a ⌋ | n \in N^{+}}$ ， $Q = {⌊ n b ⌋ | n \in N^{+}}$ ，( $⌊ x ⌋$ 指的是取 $x$ 的整数部分 $f l o o r (x)$ )，则 $P$ 与 $Q$ 是 $N^{+}$ 的一个划分，即 $P \cap Q = Ø$ 且 $P \cup Q = N^{+}$ 。

Betty序列

$a [n]$ 、 $b [n]$ 是Betty序列，可以通过Betty定理求解。

$a_{n} = [α n], b_{n} = [β n]$ ，有 $a_{n} + n = [(α + 1) n] = [β n]$ ，解方程 $\frac{1}{α + 1} + \frac{1}{α} = 1$

$α = \frac{\sqrt{5} + 1}{2}, β = α + 1$

$a_{n} = [\frac{\sqrt{5} + 1}{2} n]$ ， $b_{n} = a_{n} + n$ （方括号 $[x]$ 表示四舍五入取整函数 $r o u n d (x)$ )

参考资料

百度百科
维基百科
《算法竞赛入门提高》刘汝佳
国家集训队论文集2009-贾志豪

posted @ 2021-12-05 15:35 Chiron-zy 阅读(395) 评论(0) 编辑收藏举报

刷新页面返回顶部

登录后才能查看或发表评论，立即登录或者逛逛博客园首页

Chiron-zy的天空之境

行星和陨石在宇宙的轨道飞驰，智慧与美丽在发光的天际放逐。

组合游戏与博弈论基础

基本定义

策梅洛定理（Zermelo's theorem）

推论

SG游戏

NIM游戏

Bouton定理

单堆NIM游戏

SG函数

Sprague-Grundy 定理

SG函数性质

反SG(Anti-SG)游戏

反NIM (Anti-NIM)游戏

单堆反NIM游戏

反NIM游戏的游戏结果

Sprague Grundy——Jia Zhihao 定理

引论

SG游戏和反SG游戏模型

巴什博弈（Bash game）

巴什博弈游戏结果

反巴什博弈（Anti-Bash game）游戏结果

威佐夫博弈（Wythoff's game）

奇异局势

Betty 定理（Betti theorem）

Betty序列

参考资料

公告

我的标签

随笔分类

随笔档案

最新评论

Chiron-zy的天空之境

行星和陨石在宇宙的轨道飞驰，智慧与美丽在发光的天际放逐。

组合游戏与博弈论基础

基本定义

策梅洛定理（Zermelo's theorem）

推论

SG游戏

NIM游戏

Bouton定理

单堆NIM游戏

SG函数

Sprague-Grundy 定理

SG函数性质

反SG(Anti-SG)游戏

反NIM (Anti-NIM)游戏

单堆反NIM游戏

反NIM游戏的游戏结果

Sprague Grundy——Jia Zhihao 定理

引论

SG游戏和反SG游戏模型

巴什博弈（Bash game）

巴什博弈游戏结果

反巴什博弈（Anti-Bash game）游戏结果

威佐夫博弈（Wythoff's game）

奇异局势

Betty 定理 （Betti theorem）

Betty序列

参考资料

公告

我的标签

随笔分类

随笔档案

最新评论

Betty 定理（Betti theorem）