生活与博弈论

🌵 | 什么是博弈论


博弈论是指双方或者多方,在竞争、合作、冲突的情况下,充分了解各方信息,并依此选择一种能为本方争取最大利益的最优决策的理论。

需要注意的是,【博弈】与【博弈论】是不同的概念,博弈的字面意思是指赌博和下围棋,用来比喻为了利益进行竞争。自从人类存在的那一天开始,博弈便存在。我们身边无时无刻不在上演着一场场的博弈。而博弈论则是一种系统的理论,属于应用数学的一个分支。可以说博弈中体现着博弈论的思想,是博弈论在现实中的体现。

经济学史上有三次伟大的革命,分别是:【边际分析革命】,【凯恩斯革命】和【博弈论革命】,博弈论为人们提供了一种解决问题的新方法。

在博弈论中,最著名的一个例子便是“囚徒困境”。


🌵 | 囚徒困境

有一天警局接到报案,一位富翁被杀死在自己的别墅中,家中的财物也被洗劫一空,经多方调查,警方最终将嫌疑人锁定在杰克和亚当的身上。因为事发当晚,有人看到他们两个神色慌张地从被害人家中跑出来,警方到两人的家中进行搜查,结果发现了一些被害人家中失窃的财物,于是将二人作为谋杀和盗窃嫌疑人拘留。但是到了拘留所里面,两人都一口否认自己杀过人,他们称自己只是路过那里,想进去偷点东西,结果进去的时候就发现主人已经被杀了,于是他们随便拿了一点东西便离开了。

这样的解释不能让人信服,再说,谁都知道在判刑方面,杀人要比盗窃严重的多。警察决定将二人隔离审讯。

隔离审讯的时候,警察告诉杰克,尽管你们不承认,但是我们知道人就是你们两个杀的,事情早晚会血落石出。现在我给你一个坦白的机会,如果你坦白了,亚当拒不承认,那你就是主动自首,同时协助警方破案,你将被立即释放,亚当则要坐 10 年牢;如果你们都坦白了,那么每个人坐 8 年牢;都不坦白的话,可能以入室盗窃罪被判刑,每人 1 年。如何选择你自己想一想吧!同样的话,警察也说给了亚当。

一般人可能认为杰克和亚当都会选择不坦白,这样他们只能以入室盗窃的罪名被判刑,每人只需坐 1 年牢,这对于两个人来说是最好的一种结局。可结果会是这样吗?答案是否定的,两人都选择了不招供,结果各被判了 8 年。

事情为什么会这样呢?杰克和亚当为什么会做出这样“不理智”的选择呢?其实这种结果正是两人的理智所造成的。我们先看一下两人坦白与否及其结果的矩阵图。

亚当

坦白

不坦白

杰克

坦白

(8,8)

(0,10)

不坦白

(10,0)

(1,1)

当警察把坦白与否的后果告诉杰克的时候,杰克心中就会开始盘算:坦白对自己有利,还是不坦白对自己有利?杰克会想:如果选择坦白,要么当即释放,要么同亚当一起坐 8 年牢;要是选择不坦白,虽然可能只做 1 年牢,但也可能坐 10 年牢。虽然每人都坐 1 年牢是最好的结局,但是由于他们是被分开审讯的,信息不通,所以谁也无法保证对方是否会选择坦白。选择坦白的结局是 8 年或 0 年,选择不坦白的结局是 10 年或 1 年。在不知道对方选择的情况下,选择坦白对自己来说是一种优势策略,于是杰克会选择坦白。同时亚当也会这样想。最终的结局便是两个人都选择坦白,每人都要坐 8 年牢。

这就是著名的“囚徒困境”模式,是博弈论中最著名的一个模式。其中,杰克和亚当都选择了对自己最有利的策略,可最后得到的却是最差的结果。

从“囚徒困境”当中,我们可以得到这样的启示:

  1. 人际交往的博弈,中单纯的利己主义者并不是总会成功,有时候也会失败并且重复,博弈次数越多,失败的可能性就越大。
  2. 当今的社会环境下,遵循规则和合作比单纯的利己主义更能获得成功。


🌵 | 博弈四要素

博弈一般包含4个基本要素:

🥦 至少有两个参与者

博弈论的参与者又被称为决策主体,也就是在博弈中制定决策的人。没有参与者也就不会有博弈,且参与者至少为两人。博弈必须有对象。好比是做生意,只有买方没有卖方,或者是只有卖方没有买方,都做不成生意。有两个参与者的博弈被称为“二人博弈”,有多个参与者的博弈,被称为“多人博弈”。参与者在博弈中的表现便是制定决策与对方的决策抗衡,并为自己争取最大利益。参与者之间的关系是相互影响的,自己在制定策略的时候,往往需要参照对方的策略。

🥦 利益

从博弈论定义中,我们知道,双方或者多方进行博弈的最终目的,都是为自己争取最大利益。因此,利益是博弈中必不可少的一个要素。正是因为双方有着各自不同的利益,所以才会产生博弈。如果双方的利益相同,就不存在博弈了。

利益是一个抽象的概念,不仅仅是指钱,还可以是在一定时间段内锁定哪个电视频道,可以是指战争的胜利、获得荣誉、赢得比赛等,但是有一点 ,必须是决策主体在意的东西才能称之为利益。

🥦 策略

在博弈中,决策主体根据获得的信息自己的判断,制定出一个行动方案,这个行动方案也是策略。通俗地讲,策略就是指决策主体作出的用来解决问题的手段,计谋,计策。

博弈论的关键在于制定一个能帮助本方获取最大利益的策略,也就是最优策略。由此可见,策略是博弈论的核心,关系着最后的胜败得失。博弈,也可以看作是各方策略之间的较量,因此有人把博弈论称为“对策论”。

策略必须要有选择性,只有一种选择,那就不是策略了。如果一个犯人被抓,但是他的同伙没有落网,这时他有“供出同伙”和“不供出同伙”两种选择,同时他也有两种策略:供出同伙可以少判几年,但是出狱后有被同伙报复的危险;不供出同伙的话就得多坐几年牢。如果当时他是一个人作案,没有同伙,并且证据确凿,无论他招认还是不招认都将被判刑,这时候他就没有选择,没有选择,也就没有策略,只得乖乖的接受判罚。

🥦 信息

利益是博弈的目的,策略是获得利益的手段,而信息就是制定策略的依据,想要制定出战胜对方的策略就要获得全面的信息,对对方有更多的了解。现在无论是商场还是战场,可以说打的都是一场信息战。信息对于博弈双方来说非常重要,只有掌握了准确全面的信息,才能做出准确的判断。


🌵 | 负和博弈

负和博弈是一种所得小于所失,结果总和为负的博弈行为,也就是一种两败俱伤的博弈。

两败俱伤,是博弈中最坏的一种结果,每一位参与者的收益都小于损失,都没有占到便宜。人们可能会想,理智的人是不会做出这种事情的。事实上,人们经常将自己和对手置于两败俱伤的困境之中。战争就是最典型的负和博弈。

🥦 木匠与画家的故事

在印度流传着这样一个故事,印度北部有一位木匠,技艺高超,绝活是雕刻各种人的模型,尤其是他雕刻的侍女,栩栩如生,不仅长得漂亮还会行走,外人根本分不清真假。印度南部有一位画家,画技高超,最擅长的便是画人物。

有一天北部的木匠请南部的画家来家中做客吃饭,木匠让自己制作的木人侍女出来侍奉画家,端菜端饭,斟茶倒酒,无微不至。画家不知道这个是木人,只见这位侍女相貌俊俏,侍奉周到,便想与她搭腔,木人不会说话,画家还以为是她在害羞。木匠看到了这一幕,便心生一计,想捉弄一下画家。

晚饭过后留木匠在家过夜,并安排侍女夜里伺候画家。画家非常高兴,他等木匠走后,便细细观察这位侍女。灯光下侍女愈发好看,但是画家怎么与她说话她都不回声,最后画家便想去伸手拉她,这时才发现侍女原来是个木人。顿感羞愧万分,原来自己上了木匠的当。画家越想越生气,决定要报复木匠,于是他在墙上画了一幅自己的全身像,画中的自己披头散发,脖子上还有一根通向房顶的绳子,看上去像是上吊的样子。画好之后,他便躲到床底。

第二天,木匠见画家迟迟不起床,便去敲门。敲了一会儿也不见画家回应,便从门缝中往里看,隐隐约约看到画家上吊了,木匠吓坏了,赶紧撞开门,去解画家脖子上的绳子,等他摸到绳子之后才发现是一幅画,画家这时候从床底钻出来,对着木匠哈哈大笑,木匠十分气愤,认为画家这个玩笑开得太大了,画家则责怪木匠昨晚羞辱自己,说着说着两人便厮打起来。

这是一个典型的人际交往中的负和博弈。原本两位应该惺惺相惜,把酒言欢,没想到最后结局却是两败俱伤,虽然说这只是一个故事,但还是能给我们带来很多启示。冲突的起源在于木匠用木人侍女戏弄画家,画家发现后,又选择了报复。戏弄对方和报复对方,是造成这场负和博弈的主要原因。

人是群居的高等动物,只要生活在这个世界上,就免不了同其他人交往,这种交往关系就是人际关系。由于每个人都有自己的追求都有自己的利益,可能是物质方面的,也可能是精神方面的,因此交际中就免不了要发生冲突。冲突的结局跟博弈的结局一样,也有三种:或两败俱伤,或一方受益或共赢。两败俱伤,是最糟糕的一种情况,有过这种经历的人一般会选择反目成仇,互不往来。


🌵 | 零和博弈

零和博弈是指,在严格的竞争下,一方收益等于另一方的损失,总和为零。

零和博弈,最通俗易懂的例子就是赌博。赌场上,有人赢钱就肯定有人输钱,而且赢的钱数和输的钱数相等。就跟质量守恒定律一样,每个赌徒手中的钱在不停地变,但是赌桌上的总和却是不变的。负和博弈也是如此,博弈双方之间的利益有增有减,但是总的利益是不变的。

零和博弈的特点在于,参与者之间的利益是存在冲突的

🥦 教室与施工的故事

让我们来看一下电影《美丽心灵》中的一个情景。

一个炎热的下午,纳什教授到教室去给学生们上课,窗外楼下有工人正在施工,机器产生的噪音传到了教室中,不得已,纳什教授将教室的窗户都关上,以阻止这种刺耳的噪音。但是关上窗户之后,就面临着一个新的问题,就是教室里面太热了。学生们开始抗议,要求打开窗户,纳什对这个要求断然拒绝,他认为教室的安静比天气炎热更重要。

让我们来看一下这场博弈:

假设打开窗户,同学们得到清凉,解除炎热,他们得到的利益为 1,但是开窗就不能保证教室安静,纳什得到的利益就是 -1;如果关上窗户,学生们会感觉闷热不舒服,学生得到的利益为 -1,而纳什得到了自己想要的安静,纳什得到的利益为 1。总之,无论是开窗还是不开窗,双方的利益之和均为 0,说明这是一场零和博弈。

那么难道这个问题就没有解决的方案了吗?

当大家准备忍受纳什的选择时,一个漂亮的女同学站了起来,她走到窗户边上,打开窗户。纳什显得对此不满,想打断她(这其实是博弈中参与者对自己利益的保护),但是这位女同学打开窗户后,对楼下施工的工人们说:“嗨!不好意思,我们现在有点小问题,关上窗户,屋里太热,打开窗户又太吵,你们能不能先到别的地方施工,一会儿再回来,大约45分钟。”楼下的工人说没问题,便选择了停止施工。问题解决了,纳什用赞许的眼光看着这位女同学。

让我们来分析一下,此时外面的工人已经停止了施工,如果选择开窗大家将既享受到清凉,又不会影响安静;如果选择关窗,大家只能得到安静,得不到清凉。这个时候,纳什与学生们都会选择开窗,因为他们此时的利益不再冲突,而是相同的,所以他们之间已经不存在博弈。

这个故事告诉我们,解决负和(零和)博弈的关键,在于消除双方之间关于利益的冲突,利益不冲突并不存在博弈。


🌵 | 正和博弈

正和博弈就是,参与各方本着相互合作,公平公正,互惠互利的原则来分配利益,让每一个参与者都得到满意的结果,双方的利益都增加,总和大于 0。

博弈中发生冲突的时候,充分了解对方,取长补短,各取所需,往往会使双方走出负和博弈或者是零和博弈,实现合作共赢。

🥦 蛋清与蛋黄

有这样一个例子:一对双胞胎姐妹要分两个煮熟的鸡蛋。妈妈分她们每人一个,姐姐只喜欢吃蛋清,所以她只吃掉了蛋清,扔掉了蛋黄;相反妹妹只喜欢吃蛋黄,便把蛋清扔掉了。这一幕被他们的爸爸看在眼里,下次分鸡蛋的时候,爸爸分给姐姐两个蛋清,分给妹妹两个蛋黄,这样既没有浪费,每个人又多吃到了自己喜欢的东西。


🌵 | 纳什均衡

诺贝尔经济学奖获得者萨廖尔森曾经说过:“如果你想把一只鹦鹉训练成经济学家,只需要让它掌握两个词语:供给需求。”后来博弈论专家坎多瑞又补充:“想成为经济学家只懂得供给、需求还不够,还需要多掌握一个词,那就是‘纳什均衡’”。

“纳什均衡”的概念来自纳什的两篇论文《n 人博弈中的均衡点》和《非合作博弈》,纳什在论文中介绍了合作性博弈与非合作性博弈的区别,并给出了纳什均衡的定义。

“纳什均衡”简单来说就是,多人参加的博弈中,每一个人根据他人的策略制定自己的最优策略,所有人的这些策略组成一个策略组合,在这个策略组合中,没有人会主动改变自己的策略,那样会降低他的收益,只要没有人做出策略的调整,任何一个理性的参与者都不会主动改变自己的策略,这个时候所有参与者的策略便达成了一种平衡,这种平衡便是“纳什均衡”。

这里就不列出那时均衡的数学表达式了,因为如果你的数学不够好,这串数学表达式会让你阅读起来非常有难度。

“纳什均衡”主要用来研究非合作博弈中的均衡,因此也被称为“非合作博弈均衡”。

有人把纳什均衡比喻成锅里的乒乓球,如果你把几个乒乓球放到锅里,它们便会向锅底滚去,并在锅底相碰撞,最后停住不动的时候,便达成了一种平衡。这个时候如果动了其中的一个,其他乒乓球便会受到影响。如果想要保持住这种平衡,就不能动其中任何一个乒乓球,一直保持下去。在这个比喻中,乒乓球代表着各参与者的策略,乒乓球最后停留在锅底形成的平衡便是“纳什均衡”。

一场博弈中,并不一定只有一个“纳什均衡”,但是均衡之间有好坏之分。比如“囚徒困境”中两名囚犯同时选择不坦白,得到的均衡便是好的均衡;同时选择不坦白,得到的均衡便是坏的均衡。好的均衡的结果是双方受益,坏的均衡的结果是双方亏损,或者受益没好均衡那样多。纳什均衡中各方策略的制定都是对对方策略的最佳反应,以为自己争取最大的利益为目的,好均衡与坏均衡都是如此。


🥦 身边的纳什均衡

🥑 价格大战

商场之间的价格战屡见不鲜,尤其是家电之间的价格战,无论是冰箱、空调,还是彩电微波炉,一波未息,一波又起。这其中,最高兴的就是消费者了。仔细分析就可以发现,商场每一次价格战的模式都是一样的,其中都包含着纳什均衡。

假设某市有甲、乙两家商场,国庆假期将至,正是家电销售的旺季,甲商场决定采取降价手段促销。降价之前,两家的利益均等,假设是(10,10)。甲商场想,我若是降价,虽然单位利润会降低,但销售量肯定会增加,最终仍会增加收益,假设增加为 14。而对方的一部分消费者被吸引到了我这边,利润会下降为 6。如果同时降价的话,两家的销量都是不变的,但是单位利润的下降会导致总利润的下降,结果为(8,8)。两个商场降价与否的最终结局,如表所示。

商场乙

降价

不降价

商场甲

降价

(8,8)

(14,6)

不降价

(6,14)

(10,10)

从表中可以看出,两个商场的价格大战在博弈中有两个纳什均衡,同时降价与同时不降价,也就是(8,8)和(10,10)。这其中(10,10)是好均衡。按理说,其中任何一方,没有理由在对方降价之前决定降价,那这里为什么会出现价格大战呢?我们来分析一下。

选择降价之后的甲商场有两种结果:(8,8)和(14,6)。是甲商场的优势策略,可以得到高于降价钱的利润,即使得不到这种结果,最坏的结果也不过是前者,即(8,8),自己没占便宜,但是也没让对手占便宜。

而乙商场在甲商场做出降价策略之后,自己降价与否都将会有两种结果:(8,8)和(6,14),降价之后虽然利润比之前的 10 有所减少,但是比不降价的 6 要多,所以乙也只好选择降价,最终双方博弈的结果停留在(8,8)上面。

其实最终博弈的结果是双方都能提前预料到的,那他们为什么还要进行价格战呢?这是因为多年价格大战恶性竞争的原因,往年都要进行价格大战,所以到了今年他们知道,自己不降价也得被对方逼得降价,总之早晚得降,所以晚降不如早降,不至于落于人后。


🥑 垃圾邮件

我们时常会发现自己的电子邮箱中收到一些垃圾邮件,大部分人的做法是看也不看直接删除。或许你不知道这些令人厌恶的垃圾邮件中,也包含着一种“纳什均衡”。

垃圾邮件的成本极低,我们假设发 1 万条只需要 1 元钱,而公司的产品最低消费额为 100 元。这样算的话,发 100 万条垃圾邮件,需要的成本是 100 元,而这 100 万个收到邮件的人中,只要有一个人相信了邮件中的内容,并成为其客户,公司就不会亏本。如果有两个人订购了其产品,公司就会盈利,这是典型的人海战术。现实情况是,总有一小部分人会通过垃圾邮件的介绍成为某公司的消费者。

很多人觉得垃圾邮件不会有人去看,也有商家觉得这是一种非常傻的销售手段,从几百万人中发掘几个或者十几个客户,简直不值得去做。但是只要挖掘出两个客户,公司就有盈利,再说这种销售手段非常简便,省时省力,几乎不用什么成本,所以只要有一家企业借此盈利,其他没有发送垃圾邮件的企业便会后悔,立即加入垃圾邮件发送战中。我们来看一下其中的均衡。

发送

不发送

发送

(1,1)

(1,0)

不发送

(0,1)

(0,0)


通过这个图表,我们可以看出,垃圾邮件是如何发展到今天这一步的。在最开始没有这种销售手段的时候,商家之间在这一方面是均衡的,即(0,0)。后来有的商家率先启用垃圾邮件销售方式,此时不采用邮件销售的企业之间的利益关系对比成了(1,0)。最后,没有采用的企业发现里面有利可图,于是跟进,便达成了现在的纳什均衡(1,1)。
对于商家来说,这固然是一种好的均衡,但是作为被动的收件人来说,这次是一种坏的均衡,因为几乎没有人会喜欢自己的电子邮箱里塞满了垃圾邮件。


🌵 | 将对手拖入困境

“囚徒困境”是一把双刃剑,如果陷入其中可能会非常被动,同样如果我们能够将对手陷入其中,便会让对手被动,我们掌握主动。在“囚徒困境”这个博弈模式中,这一点就得到了很好的体现,其中警察设下了一个“困境”,将两名囚犯置身于其中,完全掌握了主动,最终得到了自己想要的结果,使两名罪犯全部招供。

但是“囚徒困境”毕竟只是一种博弈模型,博弈模型是现实生活的抽象和简化模型能反映出一些现实问题,但现实问题要远比模型复杂,模型中每一个人有几种选择,每种选择会有什么后果,这些我们都可以得知,但在现实生活中这几乎是不可能的,因为现实中影响最后结果的干扰因素太多了,正因为现实中干扰因素太多,为人们创造了一种条件,可以设计出困住对手的“囚徒困境”,让对手陷入被动。

战国策中记载了一个关于伍子胥的故事,故事中伍子胥运用的恰好就是这一策略。

年轻时的伍子胥性格刚强,文武双全,已经显露出了后来成为军事家的天赋。伍子胥的祖父、父亲和兄长都是楚国的忠臣,但是不幸遭到陷害,被卷入到太子叛乱一案中,最终伍子胥的父亲伍奢和兄长伍尚被处死。

伍子胥只身一人逃往吴国,怎奈逃亡途中伍子胥被镇守边境的斥候捉住,斥候准备带他回去见楚王,邀功请赏。危急关头,伍子胥对斥候说:“且慢!你可知道楚王为什么要抓我?”斥候说:“因为你家辅佐太子叛乱,罪该当诛。”伍子胥哈哈大笑了几声,说道:“看来,你也只是知其一不知其二。实话告诉你吧,楚王杀我全家,是因为我家有一颗祖传的宝珠,楚王要我们献给他,但是这颗宝珠早已丢失,楚王以为我们不想献上,所以杀了我的父亲和兄长,他现在认为这颗宝珠在我手上,于是派人捉拿我,我哪里有什么宝珠献给他?如果你把我押回去献给楚王,我就说我的宝珠被你抢走了,你还将宝珠吞到了肚子里,这样的话,楚王拿到了宝珠,会将你的肚子割破,然后将肠子一寸一寸的割断,即使找不到宝珠,我死之前也要拉你做垫背的。”还没等伍子胥说完,斥候已经被吓得大汗淋漓,谁都不想被别人割破肚皮,把肠子一寸寸割断,于是他赶紧将伍子胥放了,伍子胥趁机逃回了楚国。

在这个故事中一开始伍子胥处于被动,但是他非常机智,编造了一个谎言,使出了一个策略,将斥候置于一个困境中。这样他化劣势为优势,化被动为主动,很快扭转了局面。我们来看一下伍子胥使出这个策略之后,双方将要面临的局面。下面是这场博弈中双方选择和结局的矩阵图。

斥候

押送

释放

伍子胥

污蔑

(死,死)

(活,活)

不污蔑

(死,活)

(活,活)

从图中我们可以很清楚的看出,斥候被伍子胥拖入了一个困境,这只是斥候眼中的情况分析,因为现实中根本不存在宝珠这一说,这都是伍子胥编造出来的。伍子胥有言在先,如果他被押送回去,将会污蔑斥候,抢了他的宝珠,斥候会想,到时候,自己百口难辩,只有死路一条。想要活命,只有将伍子胥释放,这正中伍子胥下怀。

当人们面对危险的时候,大都抱着“宁可信其有,不可信其无”的态度。谁都不想让自己陷入麻烦,陷入困境,伍子胥正是抓住人的这一心理,才敢大胆的编造谎言来欺骗斥候,使自己摆脱困境。

这是一个很典型的将自己的困境转化为对方的困境,将自己的劣势转化为优势,将自己的被动转化为主动的故事。这种情况类似于你陷入沼泽的时候,紧紧抱住敌人的大腿,迫使他与你采取合作,帮助你成功逃脱困境。


🌵 | 制造信息不对称

唐朝时期,有一位官员接到报案,是当地一个庙中的和尚们控告庙中的主事僧,贪污了一块金子。这块金子是一位施主赠予寺庙,用于修缮庙宇用的,这些和尚们振振有词说,这块金子在历任主事僧交接的时候都记在账上,但是现在却不见了,他们怀疑是现在的主事僧占为己有,要求官府彻查。后来经过审讯,这位主事僧承认了自己将金子占为己有,但是当问到这块金子的下落时,他却支支吾吾说不出来。

这位官员在审案过程中,发现这位主事僧为人和善宽厚,怎么看都不像一个作奸犯科的人。这天夜里他到大牢中去看望这位僧人,只见他在面壁念佛,他问起这件事的时候,这位僧人说:“这块金子,我从未谋面,寺里面的僧人想把我排挤走,所以编造了一本假账来冤枉我,他们串通一气,我百口莫辩,只得认罪。”听完之后,这位官员说:“这件事让我来处理,如果真的如你所说,你是被冤枉的,我一定还你一个清白。”

第二天这位官员将这个寺庙中历任主事僧都召集到衙门中,然后告诉他们,既然你们都曾见过这块金子,那么你们肯定知道它的形状,现在我每人发给你们一块黄泥。你们将金子的形状捏出来,说完之后这些主事僧被分别带进了不同的房间,事情的结果可想而知,原本就凭空编造的一块金子,谁知道他的形状?最后当历届主事僧们拿着不同形状的黄泥出来的时候,这件案子立刻真相大白。

这个故事中的官员采取的策略是有意地制造信息不平等,使得原本主事僧们之间的合作关系不存在,每一个人都不知道别人是怎么想的,这样的做法很常见。


🌵 | 走出“囚徒困境”

🥦 合作,合作,还tm是合作

在“囚徒困境”模式中,有一个比较重要的前提,那便是双方要求被隔离审讯,这样做,是为了防止他们达成协议,也就是防止他们进行合作,如果没有这个前提,“囚徒困境”也就不复存在。由此可见,合作是走出“囚徒困境”的最有效手段。

欧派克(OPEC)是博弈中用合作方式走出困境的一个典范。

欧派克是石油输出国际组织的简称,1960 年 9 月,伊朗,沙特阿拉伯,科威特,伊拉克,委内瑞拉等主要产油国在巴格达开会,共同商讨如何应对西方的石油公司,如何为自己带来更多的石油收入,欧派克就是在这样的背景下诞生的。后来亚洲,拉丁美洲,非洲的一些产油国也纷纷加入进来,他们都想通过这一世界上最大的国际性石油组织,为自己争取最大的利益。欧派克成员国遵循统一的石油政策,产油数量和石油价格都由欧派克调度。当国际油价大幅增长的时候,为保持出口量的稳定,欧派克会调度成员国增加产量,将石油价格保持在一个合理的水平上;同样,当国际油价大幅下跌的时候,欧派克会组织成员国减少石油产量,以阻止石油价格继续下跌。

我们假设没有欧派克这样的石油组织将会出现什么样的情况?那样的话,产油国家将陷入“囚徒困境”,世界石油市场将陷入一种集体混乱状态。

首先是价格上的囚徒困境。如果没有统一的组织来决定油价,而是由各产油国自己决定油价,那各国之间势必会掀起一场价格战,这一点类似于商场之间的价格战博弈。一方为了增加收入,选择降低石油价格,其余各方为了防止自己的市场不被侵占,选择跟着降价,最终的结果是两败俱伤。即便如此,也不能退出,不然的话一点利益也得不到。囚徒困境将各方困入其中,动弹不得。

其次,产油量也会陷入囚徒困境。若是价格下降了,还想保持收益甚至增加收入的话,就势必选择增加产量。无论其他国家如何选择,增加产量都是你的最优策略。如果对方不增加产量,你增加产量,你将占有价格升降的主动权,若是对方增加产量,你就更应该增加产量,不然你将处于被动的地位。

于是,我们就应该明白欧派克的重要性了。欧派克解决了各石油输出国之间恶性降价竞争和恶性增加产油量的问题,带领各成员国走出了囚徒困境,欧派克能做到这一点的关键就在于合作。

合作,将非合作性博弈转化为合作性博弈。这是博弈按照参与方之间是否存在一个对各方都有效的协议所进行的分类。非合作性博弈的性质是,帮助你如何在博弈中争取更大的利益;而合作性博弈解决的主要是,如何分配利益的问题。在“囚徒困境”模式中,两名罪犯被隔离审讯,他们每个人都在努力做出对自己最有利的决策,这种博弈是非合作性博弈;若是允许两人合作,两人便会商量如何分配利益,怎样选择会给双方带来最大的利益,这时的博弈转化为合作性博弈。将非合作性博弈转化为合作性博弈,便消除了“囚徒困境”,这个过程中发挥重要作用的电视合作。


🥦 重复性博弈

有这样一种现象,我们经常可以见到:出去旅游的时候,旅游景点附近的餐馆,做的菜都不怎么样。这样的餐馆大都有一些共性,菜难吃,而且价格高。这样的地方去吃一次就绝不会有第二次了。既然这样,这些餐馆为何不想办法改善一下呢?仔细一想你就会明白,他们做的都是一次性买的,不靠回头客来盈利,靠的就是源源不断来旅游的人。

类似上面这样的事情,我们身边还有很多。这些事情,向我们说明了一个道理:一次性博弈中不可能产生合作,合作的前提是重复性博弈。一次性博弈对参与者来说,只有眼前利益,背叛对方对自己来说最优策略;而重复性博弈中,参与者会考虑长远利益,合作便成为可能。

关于重复性博弈与合作的关系,我们总结两点:

  1. 理性人不会选择,只与别人做一次生意,一锤子买卖。因为这样做的结果只能是短期获利,从长远来看会吃亏。考虑到长远利益,理性人会选择与对方合作,进行重复性博弈
  2. 合作的基础是长远性的交往,有共同的未来利益才会选择持续合作,没有未来利益就没有合作。

并不是只要博弈次数多于 1 就会产生合作。在无限次重复博弈情况下,合作才是稳定的。也就是说,想要双方合作稳定,博弈必须永远进行下去,不能停止。其中的原因有两点。

  1. 能带来长久利益,比如开餐馆时的回头客。
  2. 能避免受到报复,你若是背叛对方,一定会招致对方在下一次博弈中的报复。

当我们知道某一次博弈是最后一次的时候,我们就不会再考虑长久利益,也不会有下次博弈中对对手报复的担忧。这时背叛对方又成了博弈各方的最优策略。我们假设,你决定明天就将餐馆关闭或转让给他人,那么今天晚上你与顾客之间便是最后一次博弈,这个时候虽然餐馆老板基本上不会这样做,但是从博弈论的角度来说,做菜的时候偷工减料,提高菜价对你来说是最好的一种策略。

美国著名博弈论教授罗伯特·艾克斯罗德教授曾经做过这样一个有名的实验:这个实验非常简单,选择一群人让他们扮演“囚徒困境”中的其中一位囚犯的角色,将他们每一次的选择统计好之后再输入电脑里。最开始是一次性博弈,只有一次选择,结果不出意料,参与者都选择背叛对方。后来博弈次数不断增多,直至双方的博弈次数增加到了 200 次,最后统计结果告诉我们,无论是 2 次还是 200 次,只要是有限重复博弈,而不是无限重复博弈,博弈参与者都会选择背叛对方。

由于人的寿命是有限的,博弈总有结束的那一天,也就是说世界上没有什么博弈是无限重复的,按照上面的说法合作就变得永远不可能。但是,我们知道,现实生活中情况并非如此。因为没有人知道这些博弈会在哪一天结束,不知道何时结束的博弈就相当于无限重复博弈,便会催生出合作。


🥦 不要让对手看到尽头

有这样一个笑话,一个年轻人去外地出差,这期间他觉得自己头发有点长,便准备去理发,旅店老板告诉他,这附近只有一家理发店,刚开始理的还不错,但是因为只有他一家店没有竞争,所以理发师理发越来越草率。人们也没有办法选择,只得去他那里理发。年轻人想了想,笑道:“没事,我有办法。”

年轻人来到这家理发店,果然同旅店老板说的一样。店里面到处是头发,洗头的池子上到处是水锈,镜子也不知道有几年没擦了,脏乎乎的照不出人影。理发师在一旁的沙发上翘着二郎腿,叼着一只烟,正在看报纸。等了足足有三分钟,他才慢悠悠的放下报纸,喝了一口茶,然后问道:“理发呀,坐那吧。”年轻人笑着说,:“我今天只刮胡子,过两天再来理发。”理发师胡乱的在年轻人脸上抹了两下肥皂沫,三下五除二就刮好了。正如旅店老板说的,一点都没错,理发师技术娴熟,但是非常草率,甚至连下巴底下的胡子都没刮到,不过他也没说什么,笑着问道:“多少钱?”“两元。”理发师没好气儿的回答。“那理发呢?”年轻人又问到。“8 元。”年轻人从钱包里拿出 10 元递给理发师,说“不用找钱了。”理发师没见过这样大方的客户,于是态度立刻来了一个 180 度大转弯,笑盈盈地把他送到门外。临走时年轻人说两天之后来理发。

两天过去了,等年轻人再来理发的时候,发现店里面被打扫的干干净净,水池中的水锈也不见了,镜子也被擦得一尘不染。理发师笑呵呵的将年轻人迎进了店内,并按照年轻人的要求给他理发,理的非常仔细认真。理完之后理发师恭敬的站在一边,年轻人站在镜子前面看了看,对理发师的水平非常满意,然后扶了扶袖子就要出门。理发师赶忙凑上前来,说“还没给钱呢。”年轻人装出一脸不解说:“钱不是前两天一起给你了吗?刮脸 2 元,理发 8 元,正好 10 元。”理发师自知理亏,哑口无言,年轻人笑着推门而去。回到旅馆后,旅店老板和住宿的客人都夸年轻人聪明。

故事中聪明的年轻人知道自己是外地人,与当地的理发师之间做的是一锤子买卖,也就是一次性博弈。理发师八成会非常草率,于是他便聪明地将一次性博弈转化为了重复性博弈。也就是将原本一次性就可以完成的理发加刮脸,分成了两次,并且先刮脸后理发,先小后大,先轻后重。

重复性博弈的特点就在于,第 1 次制定策略时要考虑到预期收益预期风险。这个故事中理发师按理说不会考虑预期收益,因为这里只有他一家理发店,人们别无选择,但是年轻人考虑到了这一点,在第 1 次博弈,也就是刮脸的时候多给了不少钱,让对方感到了预期收益。理发师会想:我给他刮脸,刮的这样草率,他居然给了我那么多钱,下次给他理发理的好一点,他肯定会给更多钱。这样想便中了年轻人的招。

总结一下年轻人成功的关键:首先是将一次性博弈转化为重复性博弈,因为重复性博弈是合作产生的保障;其次是让对方看到未来收益(领导经常用的画大饼),这 2 点我们在买东西讨价还价的时候经常用到,讨价还价的时候,我们经常会说“下次我们还来买这个东西”,或者“我们回去用的好的话,会让同学朋友都来买你的”,这种话大都是随口说出来的,但是其中包含的道理是博弈论中重复性博弈和预期收益。

 

 

🌵 | 智猪博弈

 

🥦 小猪跑赢大猪

所谓“智猪模式”的基本情况如下:

在一个猪圈里养了两只猪,一大一小,并且在一个食槽内进食。根据猪圈的设计,猪必须到猪圈的另一端碰触按钮,才能让一定量的猪食落到食槽中。假设落入食槽中的食物是 10 份,且两头猪都具有智慧。那么当其中一只猪去碰按钮时,另一只猪便会趁机抢先去吃落到食槽中的食物,而且由于从按钮到食槽有一定距离,所以碰触按钮的猪所吃到的食物数量必然会减少。如此一来,会出现以下三种情况:

1如果大猪前去碰按钮,小猪就会等在石槽边,由于需要在按钮和食槽之间往返,所以大猪只能在赶回食槽后和小猪分吃剩下的食料,最终两只猪的进食比例是 5:5。

2如果小猪前去触碰按钮,大猪则会等在石槽边,那么等到小猪返回石槽时,大猪刚好吃光所有的食物,最终的进食比例是 10:0。

3如果两只猪都不去触碰按钮,那么两只猪都不得进食,最终的进食比例是 0:0。

在这种情况下,无论是大猪还是小猪,都只有两种选择:要么等在食槽旁边,要么前去触碰按钮。

上面的分析中我们可以发现:如果小猪等在石槽旁边,大猪去按按钮,自己将会吃到一半的食物;而如果小猪去触碰按钮,结果是一点都吃不到。所以对小猪来说,等着不动,能吃上一半,而自己去按按钮,反而一无所获。所以小猪的选择已经非常明确了,他的优势策略就是等在石槽旁。再来看大猪,他已经不能再指望小猪去按按钮了,自己按按钮的话至少还能吃上一半,要不就都得饿肚子。于是他只好来回奔波,小猪则搭便车,坐享其成。

很显然,“小猪搭便车,大猪辛苦奔波”,是这种模式最为理性,也最合理的解决方式。无论是大猪还是小猪,等着别人去碰按钮,都是最好的选择。但是,如果两者都这样的话,也就只有一起挨饿的份儿了。所以大猪不得不去奔波,被占便宜。两头猪之间的“智猪博弈”非常简单,容易理解,同时还与许多社会中的现象有相同原理,能够给人们许多启发。

生活中,我们时常看到这样一种现象:实力雄厚的大品牌会对某类产品进行大规模的推广活动,投放大量广告。不过,一段时间之后,当我们去选购这类产品时,却发现品牌繁多,还有许多其他不知名的品牌也出现在这类商品当中。那么,为什么看不到这些小品牌对自己生产的同类产品进行推广呢?这种情况就可以采用“智猪模式”来解释——想要推出一种商品,产品的介绍和宣传是不可缺少的,不过由于开支过于庞大,小品牌大多无法独立承担广告费用。于是小品牌搭乘大品牌的“便车”,在大品牌对产品进行宣传推广并形成一定消费市场后,再投放自己的产品,把他们与大品牌的同类产品摆放在一起进行销售,以获得利润。很显然在这场博弈中,小品牌就是“小猪”,而资金和生产能力都具有某种规模的大品牌则是“大猪”。

 
 

🥦 学会“抱大腿”

“智猪博弈模式”中有一种非常奇怪的现象,那就是小猪如果等着大猪去碰按钮,还能抢着一半食物吃;而如果是自己去碰按钮,反而没有食物吃。也就是,劳动反而不如不劳动。既然如此,小猪的优势策略就是趴在一边,等着分享大猪的劳动成果,也就是“抱大腿”“搭便车”。

“抱大腿”在汉语中是一个带有贬义的词汇,但是这是一种非常符合经济学理论的行为。而且,在某种程度上来说,实力稍微弱的一方可以利用他人的强势,为自己服务,甚至最终凌驾于对手之上。

四川的泸州老窖是国内白酒产品中名列前 10 的名牌产品。不过在 20 多年前,泸州老窖也只是在四川省省内小有名气,远没有今天这样的知名度。

1987 年,在泰国曼谷召开了国际饮料食品展览会。泸州老窖系列产品中的特曲酒获得该届展览会的最高奖项,3 年后,这款特曲酒又在第 14 届巴黎国际食品展览会上,荣获中国白酒产品中唯一的金奖。泸州老窖酒厂抓住时机,借助这两次国际展销会的声望和影响,邀请了当时的一些领导人以及各界有影响力的知名人士参加在人民大会堂召开的正式庆祝活动。同时,在当时的条件下,还借助各种形式的媒体,以获得国际奖项为由加大对自己产品的宣传力度,一时间泸州老窖的名字传遍了大江南北,成为了全国的知名品牌。

对泸州老窖来说,只要质量过硬,必定能把自己的产品打入全国市场,乃至国际市场,只是需要一定时间罢了。但是,泸州老窖酒厂借助产品获得国际奖项的机会,不仅提早完成了扩展市场的目标,而且省时省力,在很短的时间内就见到了成效,可谓是成功运用“抱大腿”“搭便车”这一策略的范例。

 
 

🌵 | 猎鹿博弈

猎鹿博弈的原型是这样的:

从前,某个村庄住着两个出色的猎人,他们靠打猎为生。在日复一日的打猎生活中,练就出一身强大的本领。一天他们两个外出打猎,可能是那天运气太好,进山不久就发现了一头梅花鹿,他们都很高兴,于是就商量要一起抓住梅花鹿。当时的情况是,他们只要把梅花鹿可能逃跑的两个路口堵死,那么梅花鹿便成为瓮中之鳖,无处可逃。当然,这要求他们必须齐心协力,如果他们中的任何一人放弃围捕,那么梅花鹿就能够成功逃脱,他们也将一无所获。

正当这两个人在为抓捕梅花鹿而努力时,突然一群兔子从路上跑过,如果猎人之中的一人去抓兔子,那么每人可以抓到4只。由所得利益大小来看,一只梅花鹿,可以让他们每个人吃 10 天,而 4 只兔子可以让他们每人吃 4 天,这场博弈的矩阵图表示如下:

 
 
 
 
猎人乙
 
 
 
 
 
猎兔
 
猎鹿
 
猎人甲
 
猎兔
 
(4,4)
 
(4,0)
 
猎鹿
 
(0,4)
 
(10,10)
 


第一种情况:两个猎人都抓兔子,结果他们都能吃饱 4 天,如图左上角所示。

第二种情况:猎人甲抓兔子,猎人乙打梅花鹿。结果猎人甲可以吃饱 4 天,猎人乙什么都没有得到,如图右上角所示。

第三种情况:猎人甲打梅花鹿,猎人乙抓兔子,结果是猎人乙可以吃饱 4 天,猎人甲一无所获,如图左下角所示。

第四种情况:两个猎人进行合作,一起抓捕梅花鹿,结果两个人都得到了梅花鹿,都可以吃饱 10 天,如图右下角所示。

经过分析,我们可以发现:在这个矩阵中存在着两个“纳什均衡”,要么分别打兔子,每人吃饱 4 天;要么选择合作,每人可以吃饱 10 天。在这两种选择之中,后者对猎人来说无疑能够取得最大的利益,这也正是“猎鹿博弈”所要反映的问题——合作能够带来最大的利益。

但是在生活当中,由于人们争持不下而造成两败俱伤的事情比比皆是,究其原因,主要在于每个人都是独立的个体,在决策时只从自身的利益出发进行考虑,缺少与别人必要的沟通和协调。此外,他们不懂得,合作更能够实现利益最大化的道理。

 
 

🥦 帕雷托效率

在“猎鹿博弈”模式中出现了两个“纳什均衡”:(4,4)和(10,10)。两个“纳什均衡”分别代表了两个可能的结局,但是无法确定两种结局中哪一个会真正发生。比较这两个“纳什均衡”,我们可以轻而易举地判断出两个人一起去猎鹿,比各自为战分别去抓兔子,要多得 6 天的食物。根据长期在一起合作研究的两位博弈论大师,美国的哈萨尼教授和德国的泽尔腾教授的说法,两人合作猎鹿的“纳什均衡”比分别抓兔子的“纳什均衡”具有帕雷托优势。

帕雷托优势有一个准则,即帕雷托效率准则:经济的效率体现于配置社会资源以改善人们的境况,特别要看资源是否已经被充分利用,如果资源已经被充分利用,要想再改善,我就必须损害你,或者要改善你就必须损害我。一句话,如果想要再改善,任何人都必须损害别人。这时候就说,一个经济已经实现了帕雷托效率最优;相反,如果还可以在不损害别人的情况下改善任何一个人,就认为经济资源尚未充分利用,就不能说已经达到帕雷托效率最优。

效率,指资源配置已达到任何重新改变资源配置的方式,都不可能使一部分人在不损害别人的情况下受益的状态。人们把这一资源配置的状态称为“帕雷托最优状态”或“帕雷托有效”。

“猎鹿博弈”模型是以猎人双方平均分配猎物为前提的。前面我们对“猎鹿模型”的讨论只停留在整体利益最大化方面,却忽略了利益的分配问题,帕雷托效率在利益的分配问题上体现的十分明显。

假设两个猎人的狩猎水平并不相同,猎人甲要高于猎人乙,但猎人乙的身份却比猎人甲要高贵的多,拥有分配猎物的权利。那样又会出现什么样的局面呢?不难猜出,猎人乙一定不会和猎人甲平均分配猎物,而是分给猎人甲一小部分,可能只是 3 天的梅花鹿肉,而猎人乙则会得到 17 天的梅花鹿肉。

在这种情况下,虽然两个猎人的合作使得整体效率得到了提高,但却不是帕雷托改善,因为整体效率的提高并没有给猎人甲带来好处,反而还损害了他的利益。虽然总体效益得到了提高,但是对于其中一方来说,个体利益并没有随之增加,反而是减少了。

我们再大胆假设一下,猎人乙凭借手中的特权逼迫猎人甲与他合作,猎人甲虽然表面同意,但在他心里一定会有诸多抱怨,因此当他们合作在一起时,整体效率就会大打折扣。

如果我们把狩猎者的范围扩大,变成多人狩猎博弈。根据分配,他们可以被分成既得利益集团与弱势群体,这就像前几年我国出现的一些社会现象。

在 90 年代中期以前,我国改革的进程一直是一种帕雷托改善的过程,但是由于受到各种复杂的不确定因素影响,贫富之间的差距逐渐拉大,帕雷托改善的过程受到干扰。如果任由这种情况继续下去,那么社会稳定和改革深化都会受到严峻挑战。在危机时刻,国家和政府把注意力集中到弱势群体的生存状态上来,及时地提出建设和谐社会的目标,把改革拉回到健康的发展轨道之中。

 
 

🥦 夏普里值方法

夏普里在非策略多人合作利益分配问题上有很多的贡献,他创作了夏普里值法,对解决合作利益分配问题有很大的帮助,是一种既合理又科学的分配方式。

夏普里值方法以每局中人对联盟的边际贡献大小来分配联盟的总收益,它的目标是构建一种综合考虑冲突各方要求的折中的效用分配方案,从而保证分配的公平性。

夏普里值方法解决合作利益分配问题时,需要满足以下两个条件:第一,局中人之间的地位平等;第二,所有局中人所得到的利益之和是联盟的总财富。

以下是一个例子。

在一个周末,凯文与保罗一起到郊外游玩,他们两个人都带了午餐,打算在中午休息时享用。玩了一个上午,他们把各自的午餐拿出来准备大快朵颐,但他们发现两个人所带的都是披萨饼,只是数量不同而已,凯文带了 5 块,而保罗只带了 3 块。正当他们拿起披萨准备大吃的时候,有一个像他们一样出来游玩的人凑了过来,原来他没有带食物,而且附近又实在找不到饭馆,他看到凯文和保罗所带的食物比较多,就想和他们一起吃。凯伦和保罗都是好心人,他们了解情况后就痛快地答应了那个人和他们一起享用披萨,因为饥饿的缘故,8 块披萨饼很快就被他们吃光了。那个游人为了表示自己的谢意,临走之前特意给了凯文和保罗 8 枚金币。

凯文和保罗虽然是非常好的朋友,但是 8 枚金光闪闪的金币就让他们的友谊变成了笑话 。在金钱面前,他们都表现的相当自私,谁也没有顾及友情,他们互不相让,凯文认为自己带了 5 块披萨,而保罗只带了 3 块。按照比例来分,保罗只能拿到 3 枚金币,而自己应该得到 5 枚金币。保罗认为凯伦的分配方法有问题,他觉得披萨是两个人所带来的,所以 8 枚金币也应该有两个人平分才对。他们两个人各执己见,吵了很长时间也没吵出个结果。最后凯文提议去找夏普里帮忙解决这个问题,保罗听后欣然同意。

在听过两个小家伙的叙述后,夏普里摸了摸保罗的头,用温和的语气对他说道,“你得到 3 个金币已经占了很大的便宜,你应该高高兴兴的接受才对,如果你一定要追求公平的话,那你应该只能得到 1 枚金币才对,你的朋友凯文应该得到 7 枚金币而不是 5 枚。”保罗听后十分不解地看着夏普里,他想“这是怎么回事?我的做法有什么错吗?难道夏普里是偏袒凯文不成?”

夏普里看出了保罗的困惑,就十分耐心地说,“孩子,我知道你在想什么,但是请你相信我,让我来给你分析一下你就明白了。首先,我们必须明白公平的分配并不能和平均分配划等号,公平分配的一个重要标准,就是当事人所得到的与他所付出的成一定比例。你们三人一共吃了 8 块披萨,8 块之中有你的 3 块,有凯文的 5 块。你们每个人都吃了 8 块披萨中的 1/3,也就是 8/3 块披萨。在那个游人所吃的 8/3 块披萨中,凯文带的披萨为 5 - 8/3 = 7/3,而你带的披萨为 3 - 8/3 = 1/3。这个比例显示,在游人所吃的披萨中,凯文的是你 7 倍,他留下来 8 枚金币,凯文得到的金币也应该是你的 7 倍。也就是说凯文应该得到 7 枚金币,而你只能得到 1 枚,这才是公平合理的分配方法,你觉得我说的对不对?”保罗听后仔细想了一会儿,他觉得夏普里的分析非常有道理,于是就接受了夏普里的分配方法,自己只拿了 1 枚金币,剩下的 7 枚都给了凯文。

 
 

🌵 | 枪手博弈

在博弈论的众多模式之中,有一个模式可以被简单的概括为“实力越强,死的越快”。这就是“枪手博弈”,该博弈的场景是这样设定的:

有三个枪手分别是甲,乙,丙。三人积怨已久,彼此水火不容。某天,三人碰巧一起出现在同一个地方。三人在看到其他两人的同时,都立刻拔出了腰上的手枪,眼看三人之间就要发生一场关乎生死的决斗。

当然,枪手的枪法因人而异,有的人是神枪手,有的人枪法差。这三人的枪法水平同样存在差距,其中,丙的枪法最烂,只有 40% 的命中率,乙的枪法中等,有 60% 的命中率,甲的命中率为 80%,是三人中枪法最好的。

接下来为了便于分析,我们需要像裁判那样为三人的决斗设定一些条件。假定三人不能连射,一次只能发射一颗子弹,那么三人同时开枪的话,谁最有可能活下来呢?

在博弈中,博弈者必定会根据对自己最有利的方式来制定博弈策略。在这场枪手之间的决斗中,对于每一个枪手而言,最佳策略就是除掉对自己威胁最大的那名枪手。

对枪手甲来说,自己的枪法最好,那么枪法中等的枪手乙就是自己最大的威胁,解决乙以后再解决丙,就是小菜一碟了。

对于枪手乙来说,与枪手丙相比,枪手甲对自己的威胁自然是最大的,所以枪手乙会把自己的枪口首先对准枪手 甲。

最后再来看枪手丙,他的想法和枪手里一样。毕竟与枪手甲相比,枪手乙的枪法要差一些,除掉枪手甲后再对准枪手乙自己活下来的几率总会大一些,所以丙也会率先向枪手甲开枪。

这样一来,三个枪手在这一轮决斗中的开枪顺序是:枪手甲向枪手乙射击,枪手乙和枪手丙分别向枪手甲射击。

按照几率公式计算下来,三名枪手的存活率分别是:甲 = 0.24,乙 = 0.2; 丙 = 1。

也就是说,在这轮决斗中,枪手甲的存活率是 24%,枪手乙的存活率是 20%。枪手丙,因为没有人把枪口对准他,所以他的存活率最高,是 100%。

我们知道,人的反应有快有慢,假设三个枪手不是同时开枪的,那么情况会有哪些变化呢?同样还是每人一次只能发射一颗子弹,假设三个枪手轮流开枪,那么在开枪顺序上就会出现三种情况:

1枪手甲先开枪,按照上面每个枪手的最佳策略,第一个开枪的甲必定把枪口对准乙,根据甲的枪法会出现两个结果:一个是乙被甲打死,接下来就由丙开枪,丙会对着甲开枪,甲的存活率是 60%,丙的存活率依旧是 100%;另一种可能是乙活了下来,接下来由乙开枪,那么甲依旧是乙的目标,无论甲是否被乙打死,接下来开枪的是丙,丙的存活率依然是 100%。

2枪手乙先开枪,和第 1 种情况几乎一样,枪手丙的存活率依旧是最高的。

3枪手丙先开枪,枪手丙可以根据具体情况稍稍改变自己的策略,选择随便开一枪。这样,下一个开枪的是枪手甲,他会向枪手乙开枪,这样一来,枪手丙就可以仍然保持较高的存活率,如果枪手丙依然按原先制定的策略,向枪手甲射击,就是一种冒险行为,因为如果没有杀死甲,枪手甲会继续向枪手乙开枪,如果杀死了枪手甲,那么接下来枪手乙就会把枪口对准枪手丙,此时丙的存活率只有 40%,乙便成为了存活率最高的那一个人。

赤壁之战,就是“枪手博弈”的体现。

 
 

🥦 当你拥有优势策略

从某种程度上来说,枪手博弈可以说是一种策略博弈。因为这种博弈的结果与博弈者的实力没有直接关系,反而博弈者所采用的策略会直接影响到博弈的结果。

在博弈论中有一个概念,英文写作“Dominantstrategy”,即优势策略。那么什么是优势策略呢?在博弈中,对于某一个博弈者来说,无论其他博弈者采用何种策略,有一个策略始终都是最佳策略,那么这个策略就是优势策略。简单来说,就是某些时候它胜于其他策略,且任何时候都不会比其他策略差。

举一个简单的例子。如果你是一名篮球运动员,当你运球进攻来到对方半场的时候,遭到了对方后卫的拦截。你的队友紧跟在你的后面,准备接应。于是,你和队友一起与对方的后卫形成了 2 对 1 的阵势。此时你有两种解决方法:一是与对方后卫单打独斗,带球过人;二是与队友相互配合,进行传球。

那么这两种做法就是可供你选择的策略。先看第 1 种,与对方后卫单对单。假如你运球和过人的技术比对方防守技术要好,那么你就能赢过对方。假如对方的防守技术比较厉害,那么就有可能从你的手中将球断掉。如果从这个角度来说,这个策略的成功几率只有 50%。

再看第二种,你和队友形成配合。很显然,你和队友在人数上已经压倒了对方,而且两人配合变化频繁,采用这个策略,就会使你突破对方的防守,获得很高的成功率。而且,无论对方做出怎样的举动,都无法超越这个策略所达到的效果。所以,“把球传给队友,形成配合”就是你的优势策略。

不过,关于“优势决策”需要强调一点:“优势策略”中的“优势”,意思是对于博弈者来说,“该策略对于博弈者的其他策略占有优势,而不仅是对博弈者的对手的策略占有优势”。无论对手采用什么策略,某个参与者如果采用优势策略,就能使自己获得比采用其他策略更好的结果。

 
 

🌵 | 斗鸡博弈

在斗鸡场上,有两只好战的公鸡遇到一起。每只公鸡有两个行动选择,一是进攻,二是后退。如果一方退下来,而对方没有退下来,则对方获胜,退下来的公鸡会很丢面子;如果自己没退下来,而对方退下来,则自己胜利,对方很没面子;如果两只公鸡都选择进攻,那么会出现两败俱伤的结果;如果双方都退下来,那么打成平手,谁也不丢面子。

 
 
 
 
A 鸡
 
 
 
 
 
进攻
 
后退
 
B 鸡
 
进攻
 
(-2,-2)
 
(1,-1)
 
后退
 
(-1,1)
 
(-1,-1)
 


从这个矩阵图中可以看出,如果两者都选择“进攻”,结果是两败俱伤,两者的收益均为 -2;如果一方“进攻”,另一方“后退”,“进攻”的公鸡收益为 1,赢得了面子,而后退的攻击收益为 -1,输掉了面子,但与两者都“进攻”相比,这样的损失要小;如果两者都选择“后退”,两者均不会输掉面,获得的收益为 -1。

在这个博弈中存在两个“纳什均衡”:一方“进攻”另一方“后退”。但关键是谁进谁退?在这个博弈中,如果存在着唯一的纳什均衡,那么这个博弈就是可预测的,即这个“纳什均衡”点,就是事先知道的唯一博弈结果。但是如果一个博弈不是只有一个“纳什均衡”点,而是两个或两个以上,那么谁都无法预测出结果。所以说,我们无法预测斗鸡博弈的结果,也就是无法知道在这个博弈中谁进谁退,谁输谁赢。

由此可以看出,斗鸡博弈描述的是两个强者在对抗冲突的时候,如何能让自己占据优势,获得最大收益,确保损失最小。斗鸡博弈中的参与双方,都处在一个力量均等,针锋相对的紧张局势中。

 
 

🌵 | 协和博弈
20 世纪 60 年代,英法两国政府联合投资开发大型超音速客机——协和飞机。这种飞机具有机身大、装饰豪华、速度快等很多优点,但是要想实现这些优点,必须付出很高的代价——仅设计一个新引擎的成本就达到了数亿元。英法两国政府都希望能够凭借这种大型客机赚钱,但是研究项目开始以后,他们发现了一个很严重的问题——如果要完成研发,需要不断的投入大量资金。就算研究成功,也不知道这种机型能否适应市场的需求。但是如果停止研究,那么以前的投资就等于打了水漂。

在这种两难的选择下,两国政府最后还是硬着头皮研制,成功了这种飞机投入市场以后暴露出很多缺点,如耗油量大,噪音大,污染严重,运营成本太高等等根本无法适应激烈的市场竞争,因此很快就被市场淘汰了,英法两国也遭到了很大的损失。其实,在研制协和飞机的过程中,如果英法政府能及时的选择放弃,他们就能够减少很大的损失。但令人遗憾的是,他们并没有那么做,最后协和飞机退出民航市场,才使英法两国从这个无底洞中脱身。

博弈论专家由此得到灵感,把英法两国政府在研究协和飞机时“骑虎难下”的博弈称为“协和谬误”,当人们进行了一项不理性的活动后,为此支付的时间和金钱成本,只要考虑将这项活动进行下去所需要耗费的精力,以及它能够带来的好处,在综合评定它能否给自己带来正效用。您对股票进行投资,如果发现这项投资并不能盈利,应及早停掉,不要去计较已经投入的精力,时间,金钱等各项成本,否则就会陷入困境之中。在博弈论中,这种现象被称为“协和谬误”,也称“协和博弈”。

 
 

🥦 蜈蚣博弈悖论

倒推法是分析在完全且完美状态下动态博弈的工具,虽然非常有效,但是也存在着致命的缺点。如果我们了解蜈蚣博弈悖论,就知道为什么倒推法存在着缺陷。

蜈蚣博弈是罗森塞尔最先提出的,他是这样一个博弈:博弈双方为甲和乙,两人轮流进行策略选择,可供选择的策略有两种,合作与不合作。假定由甲先选,然后是乙,接着再是甲,然后是乙……两个人就这样交替选择。假定甲乙之间的博弈次数为100次。那么这个博弈各自的支付如下:

合作 合作 合作 合作 合作
甲——乙——甲……甲——乙——{100,100}
背叛 背叛 背叛 背叛 背叛
1 2 3 n n+1

这个博弈的图形模式像一只蜈蚣,因而被称为"蜈蚣博弈"。

甲和乙是如何进行策略选择的?我们可以用逆向归纳法来分析这个博弈,在最后一步,甲在“合作”与“不合作"中进行选择时,因为“不合作”将会带来更大的利益,所以“不合作”的策略要优于“合作”,甲应当选择“不合作”。在倒数第二步,乙会这样想,下一步甲会选择“不合作”,所以我在这一步就提前背叛对方,将获得更多的好处,而避免下一次被背叛。因此在倒数第二步,乙的理性选择应该是“不合作”……以此类推,一直倒推到第一步,乙的理性选择就是不合作,这同我们前面所讲的有限次数重复性博弈中,双方达成不合作是一个道理。

这样的博弈结果是双方在第一步就不能达成一致。倒推法的结果是令人遗憾的。倒推法从逻辑推理来看是严密的,但是结论是反常理的。一开始就采取合作性策略有可能获取的收益为 100,而采取不合作的策略获取的收益为 1,这就违反常理了。从逻辑的角度看,一开始甲应该采取不合作的策略;而直觉告诉我们,采取合作策略是最优策略。甲一开始采取合作性策略的收益有可能是 0,但 1 或者 0 与 100 相比实在太小了。我们可以看到,这两者是相互矛盾的,这就是蜈蚣博弈的悖论。

博弈论专家对蜈蚣悖论做过实验研究,发现双方会自动选择合作性策略,根本不会出现一开始选择“不合作”策略而导致双方收益为 1 的情况。这种做法与倒推法相悖,但事实上,双方这样做要好于一开始甲就采取“不合作”的策略。

这样看来,倒推法是不正确的。但我们会发现,即使双方均采取合作策略,从一开始就走向合作,这种合作也坚持不到最后一步。只要是理性的人,出于自身利益的考虑,在某一步时肯定会采取不合作策略,那么倒推法肯定在这一步要起作用。合作在倒推法起作用的时候便不能进行下去。在现实中,这个悖论的对应情形:参与者不会在开始时确定他的策略为“不合作”,但是他不能确定在哪一处采取“不合作”策略。

张某是王某的朋友。王某打算向张某借钱,但又怕张某拒绝,在前往张某家的路上,他不断地想起张某家可能出现的情况:“要是他说没钱怎么办?他会不会说自己也急用钱?他会不会直接说不借我?……”这个人越想越愤怒,把自己所想的当成张某所想的,以己推人,对朋友产生了不满。“他为什么不肯借给我?朋友之间应该和睦相处,假如他向我借钱,我一定会借给他,可是我向他借钱他却不肯借给我。”

就这样,一路想着,他到了张某家,进门后便气愤地说:“不就有几个臭钱吗?我才不稀罕借呢。”他本来是借钱的,结果竟然说出这样的话,张某张口结舌,不明所以,不知何时得罪了他。

在生活中,一些喜欢以己度人的人可能会遇到这样的尴尬。虽然是个笑话,但我们发现,这个借东西的朋友所运用的思维方法有着倒推法的影子。

 
 

🥦 大甩卖的秘密

现在商品打折已经成为一种风气,走在大街小巷,总会看到商品店铺门口贴着“大甩卖”,“跳楼价”,“清仓处理”等字样,许多商店里还贴着“怒不讲价”等牌子,这种风气在整个商业系统中迅速蔓延开来,把打折当做招揽顾客的重要手段之一。

商场里“买 1 送 1”,“买 2 送 1”以及“买此物,送彼物”等广告也随处可见。每逢商场周年店庆的时候,是商家最忙的时候,他们都把周年店庆当作“答谢新老客户关爱”的最佳时刻,各种平面媒体上都有巨幅的广告在宣传,打出了类似这样的一些口号:“全场商品一律 7 折”,“满 300 送 100”,“满 400 立减 100”。这还不算,店庆本来只有一天,但商家一开就是二三周,甚至搞出一个月店庆的都有。有一些小店更夸张,他们每次都说“因为搬迁,最后一天大甩卖”,但是下次经过这家小店时,你会发现他依然好好的开在那里,而且和你上次见到的情况一样,也是“因为搬迁,最后一天大甩卖”,小店的主人似乎把每一天都当做最后一天来过。

商家的这些促销手段让人觉得自己占了便宜,买了这么多平时买不到的便宜物品。但是不要忘了,有句话叫“无利不起早”。商家如果不赚钱或者是赚的很少的话,他们还会这么做吗?谁都知道商人做生意是为了赚钱,让他们真的“大放血”是不可能的。

商家打折的秘密是什么呢?

有的商品不管你是只生产一件,还是要生产 1 万件,其中有一些投资是必须做的。也就是说,生产 1 万件商品用到的钱并不是生产一件商品的 1 万倍,而是远远小于这个数字。有些东西不管你生产多少件,其一些投入都是不变的,像厂房建筑和机器设备等。而且在短期内这些投资是固定的。

在短期内,这种在数量上不能改变的投资成本,我们称之为“不变成本”。而相对来说,一些随时可以改变数量的投资,我们称之为“可变成本”。如果你想生产一件产品,只需要几个工人就可以了;但如果你想生产 1 万件产品,那就需要投入更多的劳动力。商品所需要的总成本就等于“不变成本”和“可变成本”之和。

我们先做这样一个假设,在一段时间内,把商家生产出来的一些产品看作一个整体,再看看生产这些产品所消耗的成本,它包括“不变成本”和“可变成本”,我们把它平均分摊到每一件产品上,那么每一件产品中包含了多少“可变成本”和“不变成本”就是可以知道的了,我们由此还可以得到“平均可变成本”和“平均不变成本”的两个概念,他们相加就等于每个产品的“平均总成本”。那么商家从每件商品中获得的收益是多少呢?通过比较价格,以及以上几个方面的平均成本的大小关系,就可以知道商家每件商品的最低价格。

由此我们可以把商品的价格,从下面 3 种情况来解释:

1商品价格比平均总成本高。这就意味着厂商从每件商品中都能获取一定的利润,在这种情况下,商家因为可以赚到钱,就会扩大生产。在短期内,他们根本不能预计商品价格会发生变化,但随着商品供给的不断扩大,商品价格自然会慢慢走低。

2商品价格高于平均可变成本,但却低于平均总成本。厂商这时的销售收入已经不能弥补所消耗的所有成本了,但是总收益还是可以弥补不变的机器和厂房折旧成本,剩余的还可以补偿工人工资,自己的劳动投入等这些可变成本。由于这些折旧成本是必然的,即使你不生产,它也会发生折旧。所以对厂商来说,这时候生产比不生产好。因为生产了,至少还有一部分收入来弥补机器的折旧损失。于是,它会继续扩大生产,随着商品供给的进一步扩大,商品价格也会继续下降。

3商品价格不仅远远低于商品生产的平均总成本,还低于可变成本。这时候商品的销售收入连弥补机器的折旧费用都不够,更不要说工人的工资了。这时候厂商卖产品是赔本的,他们会停止生产。

那么,我们就很容易理解商场里商品“打折销售”的原因了。商场里的商品卖的一定比刚出厂的价格贵,这是显而易见的,因为商场到工厂进货,交易,运输,商铺铺面租金,环境布置,员工工资等,许多方面这些都需要费用。换句话说,在商场里商品的最低价格应该比生产该商品时需要的可变成本高,一些商场只有这样才能获得利润。也可以说,商场里的商品都是一个有底价的,低于这个底价卖出去就会亏本。

不过我们在上面也说过,有一小部分商场确实是降价销售的,而且商品价格往往比实际造价还低,这是由一些特殊原因造成的,比如搬迁等等。如果这时候消费者去这家商场买东西,就会获得比较实在的价格,前提是这家店确实要搬迁了或因为其他什么原因确实不再经营此店了,但是这种情况并不常见。

前面所说的“店庆”只不过是降低了每个商品的利润,利用打折的方式得到薄利多销的目的。

 
 

🌵 | 海盗分金博弈

2010 年 1 月 27 日,一艘柬埔寨货船被索马里海盗劫持,3 月 23 日一艘英属维京岛的货轮被索马里海盗劫持……索马里海盗劫持船员后,就会向相关国家和公司索要赎金,一旦不能满足,他们多会残忍地杀害人质,海盗问题已经成为各国当下需要面对的一个难题。

在我们的印象中,海盗都是一群桀骜不驯的亡命之徒,他们勒索、抢劫、杀人等等,但是在一个故事中,他们却非常民主,这个故事就是著名的“海盗分金”。

假如在一艘海盗船上有 5 个海盗,他们抢来了 100 枚金币,那么该怎么分配这些金币呢?下面是他们分配的规则:

以抽签的方式确定每个海盗的分配顺序,签号分别是 1、2、3、4、5。

其次。抽到 1 号签的海盗提出一个分配方案,对这种分配方案 5 个海盗一起进行表决,如果海盗中有半数以上(含半数)的人赞成,那么它就获得通过,并以这一方案来分配 100 枚金币;假如他提出的方案被否决了,也就是只有半数以下的人赞成或没有人赞成他的方案,那么他将被扔进大海里喂鲨鱼。这时就轮到 2 号签的海盗提出分配方案,然后剩余的 4 个海盗一起表决,他的方案和前面一样只有超过半数(含半数)的海盗赞成,他提出的这一方案才能通过,并按他的这一方案分配 100 枚金币,反之,他和 1 号海盗一样会被扔进大海里喂鲨鱼。同理 3 号、4 号海盗也和上面一样,当找到一个所有海盗都接受的分配方案时,这种情况才会结束。假如最后只剩下 5 号海盗,那么他显然是最高兴的,因为他将独吞全部金币。

对这 5 个海盗,我们先做如下的假设:

1假设每个海盗都能非常理智的判断得失,都是经济学上所说的“理性人”,并能够做出有利于自己的策略选择。换句话说,每个海盗都知道在某个分配方案中自己和别的海盗所处的位置,另外,假设不存在海盗间的联合串通或私底下的交易。

2金币是完整而不可分割的,海盗们在分配金币时,只能以一个金币为单位,而不能出现半枚这样的数字。而且不能出现两个或两个以上的海盗共同拥有一枚金币的情况。

3每个海盗都不愿意自己被丢到海里喂鲨鱼。在这个前提下,他们都希望自己能得到尽可能多的得到金币,他们都是名副其实的、只为自己利益打算的海盗,为了更多的获得金币或独吞金币,他们会尽可能投票让自己的同伴被丢进海里喂鲨鱼。

4假定不存在海盗们不满意分配方案而大打出手的情况。

如果你是 1 号海盗,你提出什么样的分配方案才能保证该方案既能顺利通过,又避免自己被其他海盗丢进大海里呢?而且这一方案还可以使自己获得更多的金币。

大部分人对这个问题的第一感觉都是抽到 1 号签的海盗太不幸运了,这是因为每个海盗都是从自己的利益出发,他们当然希望参与分配金币的人越少越好,所以第 1 个提出方案的人能活下去的几率是很小的,就算他把钱全部分给另外 4 个海盗,自己一分不要,那些人也不一定赞同他的分配方案,看起来他只有死路一条了。

但事实远不是我们想象的那样。要 1 号海盗不死其实很简单,只要他提出的分配方案能使其余 4 个海盗中至少 2 个海盗同意,就能获得通过。所以 1 号海盗为了自己可以安全地活下去,就要分析自己所处的情况,他必须笼络两个处于劣势的海盗,同意他的分配方案。怎样才能使这两个海盗同意他的方案呢?假若 1 号海盗被丢进大海,那么这两个海盗得到的金币假定为 20 枚,那么只要 1 号海盗分给这两个海盗的金币,数额大于 20 枚,这两个海盗就会赞成他的分配方案。也就是说,如果不同意他的分配方案,这两个海盗只会得到更少的金币。

1 号海盗就该想办法了,怎样的分配方案才是可行的呢?

如果第 1 个海盗从自己利益出发进行分析,而不按照这种推理方法,就很容易陷入思维僵局:“如果我这样做,下面一个海盗会如何做呢?”这样的分析坚持不了几步;就会使你不知所措。

我们可以利用倒推法来解决这个看似复杂的问题,就是从结尾出发倒推回去。因为在最后一步中往往最容易看清楚什么是好的策略,什么是坏的策略。知道最后一步,就可以借助最后一步的结果,得到倒数第 2 步应该选择什么策略?然后由倒数第 2 步的策略推出倒数第 3 步的策略,以此类推。

因此,我们应该从 4 号和 5 号两个海盗入手,以此作为问题的突破口。我们先看看最后的 5 号海盗是怎么想的,他应该是最不想合作的一个,因为他没有被丢掉海里的鲨鱼的风险。前面 4 个海盗全部扔进海里是最好的,自己独吞个 100 枚金币。但是 5 号海盗并不是对每个海盗的分配方案都投反对票,他在投票之前,也要考虑其他海盗的分配方案通过情况。

但是,这种看似最为有利的形式,对于 5 号海盗来说却未必可行。因为,假如前面 3 位都被扔进大海,只剩下他和 4 号海盗的时候,4 号海盗一定会提出这样的分配方案,那就是 100 : 0,就是 4 号海盗分 100 枚金币,5 号 0 枚。如果对这个方案进行表决,对自己的这个方案,4 号海盗肯定投赞成票,因为就只剩下他们两个人了,4 号的赞成票就占了总数的一半,这个方案一定能通过表决。结果是 5 号海盗无法改变的,金币的分配方案,在只剩下 4 号海盗和 5 号海盗的时候是 100 : 0。

再往前推,我们看看只有 3 号、4 号、5 号海盗存在的情况。根据 5 号海盗的处境,3 号海盗会提出 99:0:1 的分配方案,即 3 号分 99 枚,4 号 0 枚,5 号 1 枚。对这个分配方案投票, 3 号一定会同意,4 号海盗肯定不会同意,但 5 号海盗一定会投赞成票。为什么 5 号海盗会投赞成票呢?因为如果不这样做,那么他和 4 号两票对一票不赞成 3 号的分配方案,3 号就会被丢入大海,那么接下来就只剩 5 号和 4 号了,就回到了我们在上一段的分析:5 号将什么都分不到。因此,当 3 号、4 号、5 号海盗共存时,金币的分配方案是 99:0:1。

以这种方法再往前推,我们看看当 2 号、3 号、4 号、5 号共存时的情况:2 号海盗这时候会根据推理预测到,假如他被抛下大海,那么分配方案是 99 : 0 : 1,那么它的最好分配方案是 98 : 0 : 0 : 2,即笼络 5 号海盗,放弃 3 号海盗和 4 号海盗。表决时 5 号海盗会同意,因为前面已经说过,如果 5 号海盗不同意这一分配方案,2 号海盗就会被丢入大海,那么他只能得到 1 枚金币,但如果同意 2 号海盗的分配方案,他却可以得到 2 枚金币,他肯定选择后者。3 号海盗和 4 号海盗,因为分不到金币,肯定投反对票,那么 4 个海盗的投票情况就一目了然了,2 号和 5 号投赞成票,3 号和 4 号投反对票,2 号的方案因为有半数的人同意而通过。也就是说,在这种情况下,金币的分配方案为 98 : 0 : 0 : 2。

再往前推,我们看看 1 号到 5 号都在时,分配方案是什么样的。通过前面的分析,我们知道,假如 1 号海盗被扔进大海,由 2 号提出方案的话,3 号海盗和 4 号海盗什么都得不到。因此 1 号海盗的分配方案就应该从处于劣势的 3 号海盗和 4 号海盗入手,分给 3 号海盗 1 枚金币,分给 4 号海盗 1 枚金币,方案是 98 : 0 : 1 : 1 : 0。3 号、4 号和 1 号都会同意这一方案,很显然,就算 2 号和 5 号反对,这个方案依然会通过。

最终的结果虽然难以置信,但却合情合理。表面上看来,1 号是最有可能被喂鲨鱼的,但他不但消除了死亡威胁,还牢牢地把握住先发优势,并最终获得最大的收益。而 5 号看起来最安全,没有死亡的威胁,甚至还能坐收渔翁之利,但结果只能保住自己的性命,连一枚金币分不到。

我们在这里主要看重这种分析问题的方法,即倒推法。而在博弈学上,我们称其为“海盗分金”博弈模式。

知道上面这个模式,我们就很容易理解企业中的一把手,为什么总是和会计以及出纳们打的火热,而京城对2号人物不冷不热——因为2号人物总是野心勃勃地想取而代之,而公司里的小人物则没那么大野心。

 
 

🌵 | 路径依赖博弈

4 英寸又 8.5 英寸,这是现代铁路两条铁轨之间的标准距离,这一数字是怎么来的呢?

早期的铁路是由建电车的人负责设计的,电车所用的轮距标准就是 4 英寸又 8.5 英寸;那电车的轮距标准数字又是怎么来的呢?因为早期的电车是由以前造马车的人负责设计的,造马车的人显然很慵懒,直接把马车的轮距标准用在了电车的轮距标准上;那么马车的轮距标准又是怎么来的呢?因为英国马路辙迹的宽度就是 4 英寸又8.5 英寸,所以马车的轮距也就是这个数字,不然的话,马车的轮子就适应不了英国的路面;这些辙迹间的距离为什么又是这个数字呢?因为它是由古罗马人设计的;为什么古罗马人会用这个是数字呢?因为整个欧洲的长途老路都是由古罗马人为军队铺设的,而罗马战车的宽度就是 4英寸又 8.5 英寸,在这些路上行驶就只能用这种轮宽的战车;罗马人的战车轮距宽度为什么是这个数字呢?因为罗马人的战车是用两匹马拉的,这个距离就是并排跑的两匹马的屁股的宽度。

后来,美国航天飞机燃料箱的两旁有两个火箭助推器,是用来为航天飞机提供燃料的。这些推进器造好之后是用火车来运送的,途中要经过一些隧道。很显然,这些隧道的宽度要比火车轨道宽一点。由此看来,铁轨的宽度竟然决定了火箭推助器的宽度。我们在上面已经提过,铁轨的宽度是由两匹马屁股的宽度决定,这么说,美国航天飞机火箭推注器的宽度竟然与马屁股有关。

其实,在我们现实生活中,也有传承多年的东西。比如说中秋节送月饼,为什么赠送月饼,而不是其他什么东西呢?因为今年相互赠送月饼,是因为他们去年就相互赠送月饼。

这是日常生活中的一种普遍现象,在博弈论中,我们称之为“路径依赖”。

posted @ 2022-10-21 20:24  云散轻尘  阅读(973)  评论(0)    收藏  举报