博弈论初步

前言

“博弈论”这个算法我久仰大名，一年前就已经有所耳闻，只是我一直不会，今天简单学习了博弈论初步。

博弈论一般来讲，问题的形式就是两个人进行某种博弈，这两个人都绝顶聪明，都希望自己能赢，因此会采取最优策略，博弈论一般不会出现平局的情况。

概念

局面：游戏当前的状况
必败局面：操作到这个局面的人一定会失败，只能由必胜局面转移而来。
必胜局面：操作到这个局面的人一定会胜利，只能由必败局面转移而来。

博弈初步

Nim博弈

Nim博弈是最基础的博弈论问题之一。

问题描述：有两名玩家\(A\)和\(B\)在一起玩一个游戏，一共有\(N\)堆石子，每一堆石子有\(a[i]\)个，两人轮流取石子，每次可以从任意一堆取走任意多的石子，但不能不取，当轮到某一个人取石子的时候，如果他

不能再进行操作（也就是石子被取完了），他就输了，游戏结束。给定石子的堆数和每一堆的个数，两个人都希望采取最优解，问是否存在先手必胜的情况。

分析：问题的答案是，求每一堆石子的异或和，如果为\(0\),先手必败，如果不为\(0\),先手必胜。

证明：

设第\(i\)堆石子有\(a[i]\)个，那么必败的局面就是所有石子都被取完，此时\(a[1]\)^\(a[2]\)^\(....\)^\(a[n]=0\)。

I.如果当前处于某个局面，本局面\(a[1]\)^\(a[2]\)^\(...\)^\(a[n]=x!=0\)（也就是必胜局面），那么我们运用异或的性质，在等式两边同时异或一个\(x\)，可以得到：

\(a[1]\)^\(a[2]\)^\(...\)^\(a[n]\)^\(x=x\)^\(x=0\)

也就是说，我们可以在\(a[i]\)中找到一个数与\(x\)异或，最终使局面转为\(a[1]\)^\(a[2]\)^\(...\)^\(a[n]=0\).

这个数可以随意寻找，只要满足\(x\)^\(a[i]<=a[i]\)，那么我们就可以从某堆石子中取出\(a[i]-x\)^\(a[i]\)个石子，从而使接下来的局面异或和等于\(0\)。我们将异或和不为\(0\)的状态称为必胜局面，第一是因

为当前选手可以继续操作，第二是因为考虑最优解，就要把局面转为必败局面。

II.如果当前处于某个局面，本局面\(a[1]\)^\(a[2]\)^\(...\)^\(a[n]=0\)（也就是必败局面），那么我们当前选手无论怎样取，都会转为异或和不为\(0\)的局面，也就是必胜局面。

举例，如果当前某一项\(a[i]\)被我们变成了\(a[j]\)，由于\(a[i]!=a[j]\)，在满足\(a[1]\)^\(...\)^\(a[i]\)^\(...a[n]=0\)的情况下就不能再满足\(a[1]\)^\(...\)^\(a[j]\)^\(...a[n]=0\)，情况从必败局面转

为必胜局面，由II情况进入I情况。

综上所述，最初状态如果是必胜局面，那么处于这个局面的人必胜，否则必败。

这就是基础的\(Nim\)博弈。

取火柴游戏

#include<cstdio>
using namespace std;
int n,a[500005],maxn;
int main()
{
	int ans=0,add;
	scanf("%d",&n);
	for(int i=1;i<=n;i++)scanf("%d",&a[i]),ans^=a[i];
	if(!ans){printf("lose\n");return 0;}
	for(int i=1;i<=n;i++)
	{
		if((ans^a[i])<=a[i])
		{
			printf("%d %d\n",a[i]-(ans^a[i]),i);
			for(int j=1;j<=n;j++)
			{
				if(j==i){printf("%d ",ans^a[i]);continue;}
				printf("%d ",a[j]);
			}
			break;
		}
	}
	return 0;
}

Bash博弈

\(Bash\)博弈是另一类比较著名的博弈。

问题描述：两名玩家在一起玩游戏，一共有\(N\)个石子，每一次每个人可以取\(M+1\)个石子，问先手是否必胜？

分析：当\(N%(M+1)==0\)时，先手必败，否则必胜。

证明：

I.如果当前余下的石子数是\(M+1\)的倍数，假设当前选手取\(x\)个，另一个选手就可以在下一轮取走\(M+1-x\)个，余下的石子仍然是\(M+1\)的倍数，因此在这种情况下循环往复，直到最后游戏结束，面临\(M+1\)这种

情况的选手必败，因此这就是必败局面。

II.如果当前余下的石子数不是\(M+1\)的倍数，设余下的石子数\(n=k*(M+1)+r\)，因此当前选手总能取走\(r\)个，让余下的石子变成\(M+1\)的倍数，局面转入必败局面，因此，这就是必胜局面。

综上所述，当\(N%(M+1)==0\)的时候，先手必败，否则先手必胜。

证毕.

SG函数

\(SG\)函数是博弈论的核心，尽管很多题目它的作用仅仅是打表...因为博弈论的规律在赛场上不容易推导出来。

首先，定义一个新运算\(mex{S}\)，其结果为\(S\)集合中未出现过的非负整数，举例，当\(s={1,2,3,4}\)时，\(mem{S}=0\)，当\(S={0,1,2,3,4}\)的时候，\(mem{S}=5\)。

我们定义\(x\)为当前状态下剩余的石子数量，那么\(SG(x)=mex(SG(x-f[i]))(x-f[i]>=0)\)。

在上述计算式中，\(f[i]\)表示的是我们每次能取走的石子数量。

于是我们得出，\(SG(0)=0\)，也就是必败局面。

那么，游戏的总局面就应该是所有堆的\(SG\)的异或和，如果这个值为\(0\)，那么先手必败，如果不为\(0\),则先手必胜。

\(SG\)函数的正确性是显然的，时间紧迫就等过段时间再补充证明吧。

放一道题

这道题实际上是真的很不好做..但是我们可以通过\(SG\)函数打表实现。

#include<cstdio>
#include<cstring>
#include<algorithm>
using namespace std;
int T,n,k,f[5],sg[100005],s[100005];
void i_Play_For_SG()
{
	sg[0]=0;
	sort(f+1,f+1+3);
	for(int i=1;i<=n;i++)
	{
		memset(s,0,sizeof s);
		for(int j=1;f[j]<=i&&j<=3;j++)s[sg[i-f[j]]]=1;
		for(int j=0;j<=n;j++)
		if(!s[j]){sg[i]=j;break;}
		printf("%d : %d\n",i,sg[i]);
	}
}
int main()
{
	f[1]=1,f[2]=2;
	n=30;
    for(int i=1;i<=20;++i)
    {
        f[1]=1,f[2]=2,f[3]=i;
        printf("%d:\n",i);
        i_Play_For_SG(); 
    }
	return 0;
}

众所周知，暴力\(SG\)的复杂度是无法接受的，所以你可以根据具体的题目推导规律。

iPlayForSG是我们机房的一位神仙学长，博弈论吊打全机房的那种。（嘞是啥概念大哥牛逼！）

posted @ 2019-11-14 00:37 haruka酱阅读(345) 评论(0) 收藏举报

刷新页面返回顶部

初次见面，我是haruka。

或许是不知梦的缘故，流离之人追逐幻影。

博弈论初步

前言

概念

博弈初步

Nim博弈

Bash博弈

SG函数

公告