博弈论入门

合集 - 数论(1)

1.博弈论入门2024-08-24

博弈论入门

博弈论主要研究的是：在一个游戏中，进行游戏的多位玩家的策略。

公平组合游戏

定义:

游戏有两个人参加，轮流参加决策，双方均知道游戏的完整信息；
任意一名玩家在某一状态可以做出的决策集合只与当前状态有关，与游戏者无关；
游戏中某一状态不可能多次抵达，游戏以玩家无法行动为结束，且游戏一定会在有限步后以非平局结束。

$N i m$ 游戏

$N i m$ 游戏便是一个典型的公平组合游戏。

$n$ 堆石子，分别有 $a_{1}, a_{2}, a_{3}, a_{4} . . . a_{n}$ 个石子，两个玩家分别取走任意一堆的任意个石子，但不能不取。取走最后一个石子的人获胜。

博弈图与状态

如果将每个状态视作一个点，再将其与其后续状态连边则得到一个博弈状态图。

若将节点 $(i, j, k)$ 表示局面 $i, j, k$ 时的状态，则可以这样表示博弈状态图：

定义必胜状态(后简称 $N$ ) 为先手必胜的状态，必败状态(后简称 $P$ )为先手必败的状态。

易得以下三个结论：

没有后继状态的状态是 $P$ 。
一个状态是 $N$ ，当且仅当存在至少一个 $P$ 为它的后继结点。
一个节点是 $P$ ，当且仅当它的后继结点都为 $N$ 。

对于定理一，若游戏进行不下去了，则此玩家输掉游戏。

对于定理二，如果该状态至少有一个后继状态为 $P$ ，则玩家可以通过操作到该 $P$ 状态，则对手一定是 $P$ 状态——对手一定失败，自己就赢得了胜利。

对于定理三，如果不存在一个后继结点为 $P$ ，则无论如何操作，只能达到 $N$ ，则对手一定是 $N$ 状态——对手一定胜利，则自己一定失败。

$N i m$ 和

让我们再次回到 $N i m$ 游戏。

通过绘画博弈图，我们可以在 $O (\prod_{i = 1}^{n} a_{i})$ 的时间里求出该局面是否先手必赢。

但是，这样时间复杂度实在太高。有没有更好的方法呢?

定义 $N i m$ 和 $= a_{1} \oplus a_{2} \oplus a_{3} \oplus . . . \oplus a_{n}$ 。0

当且仅当 $N i m$ 和为零时，该状态为必败状态，否则为必胜状态。

证明

为什么异或的结果会与胜负有关？

要解决这个问题，只需证下面三个定理：

没有后继状态的状态是 $P$ 。
对于 $a_{1} \oplus a_{2} \oplus . . . \oplus a_{n} \neq 0$ 的局面，一定存在某种移动使 $a_{1} \oplus a_{2} \oplus . . . \oplus a_{n} = 0$ 。
对于 $a_{1} \oplus a_{2} \oplus . . . \oplus a_{n} = 0$ 的局面，一定不存在某种移动使 $a_{1} \oplus a_{2} \oplus . . . \oplus a_{n} = 0$ 。

对于一，唯一无后继结点的状态为全0局面，此时 $a_{1} \oplus a_{2} \oplus . . . \oplus a_{n} = 0$ 。

对于二，假设 $a_{1} \oplus a_{2} \oplus . . . \oplus a_{n} = k \neq 0$ 。设我们将 $a_{i}$ 改为 $a_{j}$ 则 $a_{j} = a_{i} \oplus k$ 假设 $k$ 的最高位为 $d$ 即 $k \in [2^{d}, d^{d + 1})$ 。根据定义，一定有奇数个 $a_{i}$ 的二进制第 $d$ 位为1。满足这个条件的 $a_{i}$ 一定也满足 $a_{j} > a_{i} \oplus k$ ，所以这是一个合法的移动。

对于三，若要将 $a_{i}$ 变为 $a_{j}$ ，根据异或的运算规则可以得出 $a_{i} = a_{j}$ ，显然不是合法移动。

有向图游戏和 $S G$ 函数

有向图游戏是一个经典的博弈游戏——实际上，大部分公平组合游戏都可以转化为有向图游戏。

在一个有向无环图上，只有一个起点，上面有个棋子，两个玩家轮流沿着有向边推动棋子，不能走的玩家判负。

定义 $m a x$ 函数的值为不属于集合 $S$ 的最小非负整数，即：

$m e x (S) = m i n {x} (x \notin S, x \in N)$

例如 $m e x ({0, 2, 4}) = 1, m e x ({1, 2} = 0)$ 。

对于状态 $x$ 和他的所有 $k$ 个后续 $y_{1}, y_{2}, . . ., y_{k}$ ，定义 $S G$ 函数：

$S G (x) = m e x {S G (y_{1}), S G (y_{2}), . . ., S G (y_{k})}$

而对于由 $n$ 个有向图组成的有向图游戏组成的组合游戏，设他们的起点分别为 $s_{1}, s_{2} . . . s_{n}$ ，则有定理：当且仅当 $S G (s_{1}) \oplus S G (s_{2}) \oplus . . . S G (s_{n}) \neq 0$ 时，这个游戏是先手必胜的。同时，这也是一个组合游戏的游戏状态 $x$ 的 $S G$ 值。

这一定理被称为 $S p r a g u e - G r u n d y$ 定理( $S p r a g u e - G r u n d y T h e o r e m$ )，简称 $S G$ 定理。

$S G$ 函数的证明

使用数学归纳法。

假设对于游戏状态 $x$ ,其当前节点 $s_{1}^{‘}, s_{2}^{‘}, . . . s_{n}^{‘} (对于任意 i 有 s_{i}^{‘} < s_{i})$ ，皆满足 $S G$ 定理，显然当 $S G (s_{1})^{‘} = S G (s_{2})^{‘} = . . . = S G (s_{n})^{‘} = 0$ 时，该状态能满足 $S G$ 定理。

只需证明对于游戏状态 $x$ ，当其节点 $s_{1}^{‘}, s_{2}^{‘}, . . . s_{n}^{‘}$ 符合 $S G$ 定理， $S G$ 定理便成立。

其实可以看做一个 $N i m$ 游戏，后略。

$S G$ 函数的应用

$S G$ 定理适用于 任何公平的两人游戏 ，它常被用于决定游戏的输赢结果。

计算给定的状态的 $S G$ 值的步骤一般包括：

获取从此状态所有可能的转换；
每个转换都可以导致 一系列独立的博弈（退化情况下只有一个）。计算每个独立博弈的 $S G$ 值并对它们进行 异或求和。
在为每个转换计算了 $S G$ 值之后，状态的值是这些数字的 $m e x$ 。
如果该值为零，则当前状态为输，否则为赢。

posted @ 2024-08-24 10:23 adsd45666 阅读(76) 评论(0) 编辑收藏举报

刷新页面返回顶部

登录后才能查看或发表评论，立即登录或者逛逛博客园首页

相关博文：

· 排列组合：公式及推导

· 10.23 闲话

· 「算法学习」博弈论初探

· 博弈论学习笔记

· 博弈论总结

阅读排行：
· winform 绘制太阳，地球，月球运作规律
· 超详细：普通电脑也行Windows部署deepseek R1训练数据并当服务器共享给他人
· 上周热点回顾（3.3-3.9）
· AI 智能体引爆开源社区「GitHub 热点速览」
· 写一个简单的SQL生成工具

公告

昵称： adsd45666
园龄： 1年1个月
粉丝： 5
关注： 6

+加关注

2025年3月

日

一

二

三

四

五

六

adsd45666的博客

博弈论入门

博弈论入门

公平组合游戏

定义:

$N i m$ 游戏

博弈图与状态

$N i m$ 和

证明

有向图游戏和 $S G$ 函数

$S G$ 函数的证明

$S G$ 函数的应用

公告

搜索

合集

随笔分类

adsd45666的博客

博弈论入门

博弈论入门

公平组合游戏

定义:

Nim 游戏

博弈图与状态

Nim 和

证明

有向图游戏和 SG 函数

SG 函数的证明

SG 函数的应用

公告

搜索

合集

随笔分类

$N i m$ 游戏

$N i m$ 和

有向图游戏和 $S G$ 函数

$S G$ 函数的证明

$S G$ 函数的应用