纳什均衡——非合作博弈,囚徒困境

1、非合作博弈是指在策略环境下,非合作的框架把所有的人的行动都当成是个别行动。它主要强调一个人进行自主的决策,而与这个策略环境中其他人无关。

博弈并非只包含了冲突的元素,往往在很多情况下,既包含了冲突元素,也包含了合作元素。即冲突和合作是重叠的。===》求个人利益最大化

2、合作博弈是指一些参与者以同盟、合作的方式进行的博弈,博弈活动就是不同集团之间的对抗。在合作博弈中,参与者未必会做出合作行为,然而会有一个来自外部的机构惩罚非合作者。

合作博弈亦称为正和博弈,是指博弈双方的利益都有所增加,或者至少是一方的利益增加,而另一方的利益不受损害,因而整个社会的利益有所增加的。===》求集体利益最大化

 

 

 

囚徒困境终于被破解了!小伙1句狠话轻松破解难题,豪取50万英镑==》本质上的解法是在将非合作博弈变成合作博弈

发布时间: 05-1122:12教育领域创作者

囚徒困境,据说是博弈论中最棘手的难题,无人可破!

不过,这个世纪难题却被一个年轻的英国街头混混用1句话给轻松破解了,并且豪取50万英镑。

01、什么是囚徒困境?

囚徒困境,是1950年美国兰德公司提出来的,并以故事的形式进行阐述:

两人因合伙盗窃杀人被逮捕,警方将他们两人分开进行审讯,并给了他们3个选择:

1、如果两个人都抵赖,各判刑1年;2、如果两个人都坦白,各判刑8年;3、如果其中一人坦白,坦白者会被释放,抵赖者则会判刑10年。很明显,两个囚徒都面临着两种选择:坦白或者抵赖。

由于两人处于隔离状态,并不知道同伙会如何选择,那么,他们就只能基于人性的自私,而去断定同伙肯定会去对其来说最有利的方式:坦白!

既然同伙坦白了,那么自己抵赖就会被判10年,太亏了。于是,他自己也会选择坦白——最坏也是8年,如果运气好,还可能直接释放。

这样一来,每个人都这样猜想对方,那么他们最终的结果就是都坦白,同时被判刑8年。

02、英国小伙破解囚徒困境的神操作!

囚徒困境充分利用了人性的自私,基本无法破解。

不过,《墨菲定律》一书中有一个经典案例,讲述了如何破解这个棘手的难题。

英国BBC公司曾经有个老牌奖游戏节目叫作《金球》,其奖金高达100万英镑,以此来吸引观众。

节目开始有四名选手参加,然后淘汰到只剩下两名选手来角逐一笔巨额奖金。角逐环节是这样的:

主持人给每个人两个球,其中一个写着“平分”,另一个写着“偷走”,两名选手需要从中选择一个球。根据两个人的选择,会出现三种情况:

1、两个人都选择了“平分”,那就两个人平分全部大奖。2、如果一个人选择“平分”而另一个人选择“偷走”,那么选择“偷走”的人拿走全部奖金,选择“平分”的人出局。3、如果两个人都选择了“偷走”,那么两个人同时出局,一分钱都拿不到。在做出各自的选择前,两个人可以互相商量,但是最后选择的时候必须单独选择。

这是一个典型的囚徒博弈游戏,相当于两个人在被捕前串供,但审讯时仍然隔离囚禁。

在这个规则之下,常常会出现这样的情况:

其中一人信誓旦旦地保证自己一定会选择“平分”, 同时让对方也选择“平分”,这样两个人就可以平分奖金。

但事实上,到最后选择时,他一定会选择“偷走”,而另外一个人不相信他,也会选择“偷走”,于是两人全部出局。

这个节目,将囚徒困境玩到了极致,一度没有任何选手能够拿走这100万英镑。

直到,一个名叫尼克的街头小混混走了进来。

尼克在那期节目中运气不错,杀入了最后的角逐,他的对手或者说伙伴,名叫亚伯。亚伯与以往几期的选手一样,向尼克保证自己一定会选择“平分”,恳请尼克也选择“平分”。

然而,令亚伯没想到的是,尼克非常的强硬地表示自己一定会选择“偷走”!

听到这话,不仅亚伯懵逼了,就连主持人和观众都傻了。

这哥们儿,咋不按套路出牌呢?

而且,你TM这样直说选择“偷走”的话,别人还怎么跟你玩儿?

这不是同归于尽的打法吗?

不过,尼克又补充了一句,说道:“亚伯,我发誓,我一定会选择‘偷走’。不过,只要让我拿走这笔钱,我也一定会在节目结束后和你平分!”

亚伯当然不可能就这样信任陌生的尼克,气得大骂尼克无耻,但尼克就是丝毫不肯让步。

这样一来,亚伯就只剩下两种选择:

选择“偷走”,两个人都拿不到钱;选择“平分”,尼克拿走全部奖金,但是有可能会在节目结束后与自己平分。无奈之下,亚伯只能选择更好的选项——“平分”,至少还有可能拿到一半奖金。

而尼克的选择却出人意料,并没有像他之前强硬表示的那样选择“偷走”,而是同样选择了“平分”。因此,两人平分了奖金,赢走了《金球》的100万英镑。

posted @ 2021-07-19 17:17  bonelee  阅读(1812)  评论(0编辑  收藏  举报