博弈论

博弈论

相关概念

公平组合游戏

公平组合游戏(ICG 游戏)定义为:

  • 双人(游戏有两个人参与),回合制(二者轮流做出决策),信息完全公开(双方均知道游戏的完整信息)。
  • 任意一个游戏者在某一确定状态可以作出的决策集合只与当前的状态有关,而与游戏者无关。
  • 游戏中的同一个状态不可能多次抵达,游戏以玩家无法行动为结束,且游戏一定会在有限步后以非平局结束。
    • 一般来说,无法行动的玩家为败者。

因此 ICG 游戏可以转化成 DAG,一个状态是一个点,一个决策是一条边,而终止状态指的就是出度为 0 的点,称其为博弈状态图。

这样,对于组合游戏中的每一对弈,我们都可以将其抽象成图中的一条从某一顶点到出度为 0 的点的路径。

必胜态与必败态

在公平组合游戏中,定义:

  • (先手)必胜状态:从当前状态开始操作的玩家有必胜策略。
  • (先手)必败状态:无论从当前状态开始操作的玩家如何操作,另外一位玩家在之后都有相对应必胜策略。

通过推理可得下面两条定理:

  • 一个状态是必胜状态,当且仅当它存在至少一个必败的后继状态。
  • 一个状态是必败状态,当且仅当它的所有后继状态均为必胜状态。

如果博弈图是一个 DAG ,则通过这两个定理,我们可以在绘出博弈图的情况下用 O(n+m) 的时间复杂度 DP 出每个态是必胜状态还是必败状态。

有向图游戏

有向图游戏:在一个有向无环图中,只有一个起点,上面有一个棋子,两个玩家轮流沿着有向边推动棋子,不能走的玩家判负。

有向图游戏的和:一个游戏可能是由多个子游戏组成的(将其记作 G1n ),如果整个游戏进行时,玩家可以任意选取一个子游戏进行上面的合法操作,所有子游戏均无法进行合法操作时判负。整个游戏称为子游戏的游戏和,记作 G=G1+G2++Gn

SG 定理

对于状态 x 和它的所有 k 个后继状态 y1k ,定义 SG 函数:

SG(x)=mex{SG(y1),SG(y2),,SG(yk)}

而对于由 n 个有向图游戏组成的组合游戏,设它们的起点分别为 s1n ,则有 SG 定理(Sprague–Grundy Theorem):当且仅当

SG(s1)SG(s2)SG(sn)0

时,这个游戏是先手必胜的。同时,这是这一个组合游戏的游戏状态 x 的 SG 值。

证明:

使用数学归纳法,假设对于游戏状态 x ,其当前节点 s1ni,si<si )符合 SG 定理,SG 定理便成立。

事实上这一个状态可以看作一个 Nim 游戏,对于某个节点 si ,它可以移动到任意一个 SG 值比它小或比它大的节点。

在有向图游戏中,当一方将某一节点 si 移动到 SG 值比它大的节点时,另一方可以移动回和 SG 值和 si 一样的节点,所以向 SG 值较大节点移动是无效操作。

当移动到 SG 值较小的节点时,情况则会和 Nim 游戏一样,能够到达任何一个游戏状态 x 使得 SG(x)=SG(s1)SG(s2)SG(sn)<SG(X) (注意到前文已经假设 x 满足 SG 定理),但到达不了 SG 值为 SG(s1)SG(s2)SG(sn) 的节点。

所以状态 x 符合 SG 定理。

SG 定理适用于任何公平的两人游戏,它常被用于决定游戏的输赢结果。

计算给定状态的 SG 值的步骤一般包括:

  • 获取从此状态所有可能的转换。
  • 每个转换都可以导致一系列独立的博弈(退化情况下只有一个)。计算每个独立博弈的 SG 值并对它们进行异或求和。
  • 在为每个转换计算了 SG 值之后,状态的值是这些数字的 mex
  • 如果该值为零,则当前状态为输,否则为赢。

事实上还有很多非 ICG 游戏,不能够直接用 SG 函数解决,例如:

  • 非回合制游戏:可能可以通过收益矩阵等方法解决。
  • 不平等回合制博弈:可能可以通过对抗搜索、超现实数等方法解决。
  • 博弈图带环的回合制博弈:可能会出现无法终止的情况;

Nim 博弈及变种

Nim 游戏

P2197 【模板】Nim 游戏

n 堆石子,第 i 堆有 ai 个石子。

游戏双方轮流取石子,每次只能从其中一堆中取出任意数目的石子,不能不取。

取完者获胜,求先手是否有必胜策略。

n,ai104

Bouton 定理:定义 Nim 和为 a1a2an ,当且仅当 Nim 和为 0 时先手必败。

证明:只需要证明:

  • 没有后继状态的状态是必败状态。
    • 没有后继状态的状态只有一个,即全 0 局面,此时 Nim 和为 0
  • 对于 Nim 和不为 0 的局面,一定存在某种移动使得 Nim 和为 0
    • 不妨假设 Nim 和为 k ,若要将 ai 改为 ai ,则 ai=aik 。设 k 的二进制最高位 1d ,根据异或定义,一定有奇数个 ai 的二进制第 d 位为 1 。满足这个条件的 ai 一定也满足 ai>aik ,因而这是合法的移动。
  • 定理三:对于 Nim 和为 0 的局面,一定不存在某种移动使得 Nim 和为 0
    • 如果我们要将 ai 改为 ai ,则根据异或运算律可以得出 ai=ai ,这不是合法的移动。

应用

HDU1730 Northcott Game

有一个 nm 列的棋盘,每行有一个黑棋(先手)和一个白棋(后手)。每次可以把某一行自己的棋子移动到同一行任意一格,但不能越过对方的棋子。不能移动的人输,求先手是否必胜。

n1000m100

考虑黑棋在左边时黑棋的移动情况,其余情况是对称的。若黑棋往左移动,则白棋可以模仿其进行同样的移动。

那么一行就可以抽象为有 |ab|1 个石子( a,b 为横坐标),于是可以转化为 Nim 游戏。

Anti-Nim

P4279 [SHOI2008] 小约翰的游戏

n 堆石子,第 i 堆有 ai 个石子。

游戏双方轮流取石子,每次只能从其中一堆中取出任意数目的石子,不能不取。

取完者失败,求先手是否有必胜策略。

这与 Nim 游戏唯一不同的地方就是胜负判定与其相反。

结论:

  • 全部 ai=1 时,当且仅当石子堆数为奇数时先手必败。
  • 至少一个 ai>1 时,当且仅当 Nim 和为 0 时先手必败。

证明:第一种情况显然,考虑证明第二种情况。

  • Nim 和非 0
    • 若还有至少两堆石子数量 >1 ,直接将 Nim 和变为 0 即可。
    • 否则直接考虑取 >1 的那一堆,并且可以控制剩下 1 的堆数,因此此时先手必胜。
  • Nim 和为 0
    • 若还有至少两堆石子数量 >1 ,决策完后 Nim 和一定非 0
    • 否则显然先手必败。

注:Anti-Nim 的结论不能直接搬到一般的 ICG 游戏的 SG 函数上。因为之前的推导中运用到了必败态为 0 的条件,但这在 Anti-Nim 中不成立。

Staircase-Nim

给定 n 个阶梯,每一个阶梯有若干个石子。

游戏双方轮流任意选取一个有石子的阶梯,将任意数量(至少为 1 )石子移动到下一个阶梯上。

具体地,从编号为 i 的阶梯拿到 i1 阶梯上。若 i=1 ,则直接拿走石子。

取完者获胜,求先手是否有必胜策略。

结论:Staircase-Nim 游戏的性质与在奇数编号阶梯上做 Nim 游戏的性质相同。

证明:若在奇数阶梯上 Nim 和非 0 ,那么可以采取以下策略:

  • 按照 Nim 游戏的必胜策略将某一奇数阶梯上的一些石子移动到其下的偶数阶梯上(相当于丢弃)。
  • 若对手也移动奇数阶梯上的石子,相当于配合你做 Nim 游戏,否则只要将这些石子再移动到再其下的偶数堆即可。

不难发现这样操作始终能保证自己必胜,必败情况的等价性质类似证明即可。

Nim-K 游戏

n 堆石子,每堆有 ai 个。

游戏双方轮流取石子,每次可以选堆数 [1,m] 的若干堆,并从这几堆中各取若干石子。

取完者获胜,求先手是否有必胜策略。

结论:当前状态必败,当且仅当对于每一个二进制位,这一位 1 的数量 mod(m+1)0

证明:类似 Nim 博弈,只需证明:

  • 结论一:全 0 的局面一定是必败态。
    • 显然。
  • 结论二:任何一个必败态,经过一次操作后必然会回到必胜态。
    • 一次移动中至少有一个二进制位被改变。由于最多只能操作 m 堆石子,所以对于任意位,1 的个数至多改变 m 。而由于原先每一位 1 的数量均为 m+1 的整数倍,所以操作后必然存在一位 1 的数量不是 m+1 的整数倍。
  • 结论三:任何一个必胜态,总有一种操作后会回到必败态。
    • 考虑归纳法,假设用某种方法改变了 k 堆,使比第 i 位高的所有位的 1 的个数都变成 m+1 的整数倍。现在要证明总有一种方法让第 i 位也变成 m+1 的整数倍。显然,对于已经改变的那 k 堆,当前位可以自由选择 10 。设除去已经更改的 k 堆,剩下的堆第 i 位上 1 的总和 modm+1=S 。若 Smk ,此时可以将这些堆上的 1 全部拿掉,然后让那 k 堆的第 i 位全部置为 0 ;否则此时在之前改变的 k 堆中选择 m+1S 堆,将它们的第 i 位置为 1 且剩下位置置为 0

经典模型

巴什博弈

n 个石子,两个人轮流取,每次可以取 1m 个。

取完者获胜,求先手是否有必胜策略。

结论:当且仅当 nmod(m+1)=0 时先手必败。

威佐夫博弈

P2252 [SHOI2002] 取石子游戏|【模板】威佐夫博弈

有两堆各 n,m 个物品,两个人轮流操作,操作有两种:

  • 从任意一堆中取出至少一个。
  • 同时从两堆中取出同样多的物品,规定每次至少取一个。

取完者获胜,求先手是否有必胜策略。

n,m109

结论:记两堆石子为 n,m ,其中 nm ,若 n=5+12×(mn) 则先手必败。

注意稍微化一下式子,避免浮点数运算,不然会被卡精度。

斐波那契博弈

有一堆个数为 n 的石子,双方轮流取石子。要求:

  • 先手不能一次取完所有石子。
  • 之后每次可以取的石子数介于 1 到对手上一次取的石子数两倍之间。

取完者获胜,求先手是否有必胜策略。

结论:先手必败当且仅当 n 是斐波那契数。

证明:先引入齐肯多夫定理:任何整数可以分解成若干个不连续的斐波那契数之和。

n=fi+fi1+fik ,那么先手先取 fik ,由于后手不能取大于等于 2×fik 的项,则 n 中剩下的斐波那契项,先手都可以取到最后一颗。

翻硬币游戏

n 枚硬币,已知其初始状态。每次可以选择一个反面向上的硬币,并将其与其有约束的硬币同时翻转。

不能翻转者输,求先手是否有必胜策略。

结论:局面的 SG 值为局面中每个正(反)面朝上的棋子单一存在时的SG值的异或和。

因此,若翻转一个硬币只会影响比它小的硬币,则其单一存在时后面的硬币可以忽略。

P4077 [SDOI2016] 硬币游戏

n 枚硬币,已知其初始状态。每次可以选择一个反面向上的硬币 x=c2a3b ,其中 2c3c ,并选择执行一种操作:

  • 选择 p,q 满足 pqap11qMAXQ ,然后同时翻转所有编号为 c2apj3b 的硬币,其中 j=0,1,2,,q
  • 选择 p,q 满足 pqbp11qMAXQ ,然后同时翻转所有编号为 c2a3bpj 的硬币,其中 j=0,1,2,,q

无法操作者输,多组数据询问是否先手必胜。

n3×104

首先可以发现不同的 c 之间互相独立,最后用 SG 定理合并即可。

现在仅需考虑独立的 2a3b ,可以发现 2a3b 局面的并就是 2a3b 的局面,因此仅需考虑 2a 的情况。

将指数拿下类,那么一次操作相当于翻转 a,ap,a2p,,aqp 的硬币。

根据经典结论,SG(a) 的状态来源有 SG(ap),SG(ap)SG(a2p), ,因此:

SG(a,b)=mex{SG(ap,b),SG(ap,b)SG(a2p,b),,SG(a,bp),SG(a,bp)SG(a,b2p)}

二分图博弈

特点:有向图游戏,满足有向图为二分图。

将每个状态看做一个点,那么这些点和合法转移会构成一个二分图。

S 集合视作轮到先手决策的点,T 集合则代表轮到后手决策的点。

先跑一遍二分图匹配,对于任意一点 x ,有两种情况:

  • 不属于最大匹配(非匹配点):走一步后必然会走到一个匹配点(否则相当于找到了一条增广路)。而走到一个匹配点后,对方可以不断沿着匹配边走,最后必然会停留在 S 集合,也就是先手必败(如果停留在 T 集合,相当于找到了一条增广路)。
  • 最大匹配的非必须点:不管它怎么走,走到的目标节点一定会在某种情况下属于最大匹配,因此先手必败。
  • 最大匹配的必须点:这个点先手必胜。因为总能走向另一个匹配点。

P4055 [JSOI2009] 游戏

给定一个 n×m 的网格图,有若干格子有障碍。A 先选择一个起点放棋子,然后从 B 开始,两人轮流移动棋子,不能移动到走过的位置,无法移动者输。求 A 是否有必胜策略,若有还需求出所有有必胜策略的起点。

n,m100

将相邻两个非障碍点连边,可以得到一张二分图,找最大匹配的非必须点即可。

应用

P3235 [HNOI2014] 江南乐

n 堆石子,第 i 堆有 ai 个。

一次操作可以将一堆数量为 i(iF) 的石子分为:jimodj 堆数量为 ij 的石子、imodj 堆数量为 ij 的石子。其中 j 可以自己选定,需要满足 2ji

无法操作者输,求是否存在先手必胜策略。

多组数据,但 F 不改变。

T,n100F,ai105

考虑求出每个数的 SG 值,这样直接判断异或和是否非 0 即可。

首先,对于 i<F ,显然先手必败,故 SG(i)=0 。否则枚举每个 j ,计算各个子游戏的 SG 函数的异或和的 mex 即可,直接做是 O(V2+Tn) 的。

考虑整除分块,对于一段 [l,r] ,发现 SG 函数相同的点交替出现,自然想到异或和奇偶性的关系,分类讨论:

  • 2ij :此时 jimodj=j(1+ij)i 奇偶性不变,因此该部分贡献不变。
  • 2ij :此时 imodj=ijij 奇偶性不变,因此该部分贡献不变。

因此两个部分中,总有一个部分贡献不变,于是只要枚举两个 j 即可。

时间复杂度 O(VV+Tn)

P9169 [省选联考 2023] 过河卒

有一个 n×m 的棋盘,棋盘上有一些障碍,还有一个黑棋和两个红棋。

红方先走,黑方后走,双方轮流走棋。红方每次可以选择一个红棋 (i,j) ,走到 (i1,j),(i+1,j),(i,j1),(i,j+1) 中的一个,只要这个目的地在棋盘内且没有障碍且没有红方的另一个棋子。

黑方每次可以将自己的棋子 (i,j) 走到 (i1,j),(i,j1),(i,j+1) 这三个格子中的一个,只要这个目的地在棋盘内且没有障碍。

在一方行动之前,如果发生以下情况之一,则立即结束游戏,按照如下的规则判断胜负(列在前面的优先):

  • 黑棋位于第一行:黑方胜。
  • 黑棋和其中一个红棋在同一位置:上一步移动者胜。
  • 当前玩家无法操作:对方胜。

假设双方采用最优策略:

  • 若存在必胜策略,则选择所需步数最大值最少的操作。
  • 若不存在必胜策略,但存在平局策略,则选择任意一种平局策略。
  • 若不存在不败策略,则选择对方获胜所需步数最小值最大的操作。

判断游戏是否会平局,若不会需要求出结束时双方一共移动了多少步。

n,m10

设状态 (i,j,a,b,x,y,0/1) 表示黑棋在 (i,j) 、红棋在 (a,b),(x,y) 、红/黑先手。先建出有向图,然后考虑移动步数,显然这是一个 DAG 上的最短路问题,直接拓扑排序即可。

时间复杂度 O((nm)3)

UOJ51. 【UR #4】元旦三侠的游戏

初始时有 a,b ,双方轮流操作,每次可以令 ab 增加 1 并满足 abn

无法操作者失败,给定 nm 次询问 (a,b) 是否先手必胜。

n109m105a2b1

对于一个 banb ,于是状态只有 b=1lognnb 种。

发现当 a>nb+1 时只能增加 a ,因此有用的状态只有 b=2lognnb<nlogn 个,剩下的只要求出 a 与其的差值的奇偶性即可。

时间复杂度 O(nlogn)

P3185 [HNOI2007] 分裂游戏

n 堆石子,第 i 堆有 ai 个。每次操作可以选择三个位置 i<jk ,令 ai 减一,并令 aj,ak 均加一,其中 j,k 可以相等。

双方轮流操作,求是否存在先后必胜策略,若存在需要求出先手必胜时可能的第一次操作种数以及字典序最小的操作。

n21

先考虑结束状态,显然前 n1 堆都没有石子时结束。

考虑将每个石子视作一个子游戏,一次操作相当于拿走第 i 堆的一个石子到 n ,然后在第 j,k 堆产生一个新的子游戏,那么有 SG(i)=mexi<jk{SG(j)SG(k)}

由 SG 定理,一个位置的石子只要保留 mod2 即可(异或抵消)。

对于方案求解,可以直接枚举第一次操作算 SG 值。

时间复杂度 O(n3)

CF2062E2 The Game (Hard Version)

给出一棵树,点有点权。双方轮流操作,每次可以选择点权严格大于上一次点权的点,并删掉其整个子树(包括这个点)。第一次可以任意选取,无法操作者获胜。找出所有先手必胜的操作点,或报告无解。

CF2062E1 The Game (Easy Version) :找到一个先手必胜的操作点,或报告无解。

n4×105

先考虑 E1,答案即为点权最大的点 u ,满足子树外存在一点 v 满足 valv>valu 。这样对手剩下能选的点一定不满足这个形式,于是先手就无法操作。

接下来考虑 E2,一个暴力是枚举所有操作点,然后把删去点权不超过它的点和它的子树,再用 E1 的方法判定。

记先手选的点为 u ,则必胜条件为对于所有 wv>wu 均满足两个条件之一:

  • v 位于 u 的子树内。
  • 权值大于 v 的点 wuv 的子树内。

那么扫到 v 时,记所有不在 v 子树内的 w 的 LCA 为 W ,那么判定条件为 uvW 的祖先。

考虑按点权倒序枚举点,记点权大于该点的 LCA 为 W ,则 1W 的链上的点的交就是 u 的可行点集,树上差分判断即可,注意判定第一次选完点之后不能让对手无法操作。

接下来考虑求 W ,只要用一个 set 维护权值大于 u 的节点的 dfn,根据经典结论每次找到不在 u 子树内 dfn 最大最小点的 LCA 即可。

时间复杂度 O(nlogn)

七管荧光灯

一个七管荧光灯如图所示:

对于一次游戏,七条边上分别有一些石子(可能没有)。先后手轮流取石子,每一次可以选择某些连通的边(但是选择的边不 得成环),并从其中的每条边上各选择若干个石子移走(可以为 0 ,但是一次操作至少要取走一个石子)。无法操作者输。

给出七条边石子数量的上下界 l17,r17 ,求有多少种先手必胜的方案。

l17,r171018

结论:先手必败当且仅当 1,2,3 条边的石子相等,5,6,7 条边的石子相等,且 1,4,7 条边的石子异或和为 0

证明类似 Nim 游戏:

  • {1,2,3},{4},{5,6,7} 三个集合内部石子不相等,则先手可以将它们调整至相等,同时可以使得 1,4,7 条边的石子异或和为 0
  • 对于剩下的操作,显然可以钦定每次集合内选取状态相同(否则后手仍可以在操作的同时调整至相同),又因为每次只能选一个集合,于是转化为 Nim 游戏。

然后直接容斥配合数位 DP 统计必败态即可。

本文作者:wshcl

本文链接:https://www.cnblogs.com/wshcl/p/18666959/GameTheory

版权声明:本作品采用知识共享署名-非商业性使用-禁止演绎 2.5 中国大陆许可协议进行许可。

posted @   wshcl  阅读(34)  评论(0编辑  收藏  举报
点击右上角即可分享
微信分享提示
评论
收藏
关注
推荐
深色
回顶
展开