重读博弈论(五)--纳什均衡
纳什均衡与优势策略均衡是完全不同的,纳什均衡给出了对问题的一种新的分析方法。它往往用于在没有优势均衡与重复剔除优势均衡的情况之下。它的正确并不容易看出,但普遍的应用却很广泛。
智猪博弈
在下面的例子之中:
猪圈里有两头猪,一头大猪,一头小猪。猪圈的一头有一个猪食槽,另一头安装一个按钮,控制猪食的供应。按一下按钮会有10个单位的猪食进槽,但谁按按钮就需要付2个单位的成本。若大猪先到,大猪吃到9个单位的猪食,小猪只能吃到1个单位;若同时到,大猪吃7个单位,小猪吃3个单位;若小猪先到,大猪吃6个单位,小猪吃4个单位。
两猪同时按按钮,因而同时到猪食槽。大猪吃7个单位,小猪吃3个单位,并扣除2个单位的成本,获得水平分别为5和1。其它情形可以类推。
小猪
按键 等待
按键 5,1 4,4
大猪
等待 9,-1 0,0
智猪博弈中,不存在优势策略均衡。大猪将如何做,将取决于它认为小猪如何去做。
此时,对于大猪来说,如果小猪不按键,它就会去按,如果它认为小猪去按,它不就去按,等着小猪按键后去吃。
此时,可以寻找其中的纳什均衡。
纳什均衡的定义:
在一个策略组合中,在其它参与人都不会改变已有策略的条件下,如果没有参与人激励去改变自身的策略,则称该策略组合为纳什均衡。
简单看来,大猪选择按键,无论发生什么情况总是可以获取支付,而小猪选择按键,则有可能只得1或什么都没有,而且心理上还受到打击,如果选择等待,则会发现,要么不得,要么可以得到4的支付,明显优于跑去按键。
在图表中,这个博弈的结果显得比较明确,最终行为的结果会导致大猪总是按键,小猪总是等待。
性别战
性别战是一个较有代表性的博弈形式,它是协调博弈,之所以称之为协调博奕,自然有它的道理。在没有聚点的情况下非合作协调博弈中,很容易产生一些尴尬的情景。
很多误会的产生,实际就是协调博弈中的一种形式:由于在事先不能进行的信息交流,所以造成了事情最终的成功的可能性只达到50%。这听起来好像是愚蠢的,但确实有这样的事情。
比较著名的就是欧.亨利的小说<<麦琪的礼物>>中,男女双方结婚纪念日时,男方卖了怀表给女方卖梳子,而女方卖了头发给男方买了表链,最后造成了双方买来的礼物都没什么实际的价值。更有趣的,这种条件之下,事先的信息交流,会使得一切变得索然无味,让事情变得没有价值。
性别战的经典表述是:男方喜欢看拳击,而女方喜欢看芭蕾,虽然大家是自利的,但他们因为相爱,以至于如果需要的话,其中一方可以牺牲自己的喜好来陪伴对方。
支付如下:
女
拳击 芭蕾
拳击 2,1 0,0
男
芭蕾 0,0 1,2
明显的是,这里存在着两个均衡,这往往会出乱子。不过,如果该博弈不断重复,可以预计的是:最终会产生一个聚点,稳定在其中一个均衡之上。
在性别战中,任一纳什均衡都是帕累托有效的,其他任一组合都不可能在不降低其它人的支付的条件下提高另一参与人的支付。这里需要提及的是:囚徒困境就不是帕累托有效。例如:(坦白,坦白)是唯一的纳什均衡,它的支付帕累托劣于(抵赖,抵赖)所产生的支付,但情况并非是双赢,因为不降低对方的支付,就无法提高自己的支付,这种情况之下,最终产生的均衡结果是完全不同的。
形象一些:如果在提高自己支付的同时,也能够为对方带来利益,最后形成的均衡点,才是帕累托有效的。如果是在提高自己支付的同时,降低了对方的支付,最终形成的均衡,就并非是帕累托有效的。
性别战博弈的启示是:在对方不会拆台的情况下,都有共同达到赢利的目标时,成功达到均衡的关键是谁先采取行动,谁就能够占领先机,获得优势。
斗鸡博弈
两个人开车从只能容纳一辆车的桥的两端向中间前进,每个人都有两种战略:前进或退下阵来。若两人都继续前进,则两败俱伤;如果一方前进,另一方退下来,前进者取得胜利,退后者丢了面子;若两人都退了下来,则都丢了面子。支付矩阵如下:
A
进 退
进 (-3,-3) (2,-1)
B
退 (-1,2) (-1,-1)
此处的纳什均衡就是(退,进),(进,退)
如果一方可以观察到另一方,可以分先后的话,无疑会停在上面的两个均衡之一,但不幸的是,此处的条件是双方同时进行,没有任何一方知道对方的策略。
本博弈的特征在于:在事情未发生之前,双方预先决定的策略决定了最终的结果,如果双方都选择避让,那么就无法完成一件事情,如果双方都不避让,这会双方都遭受巨大的损失。这也就是通常说的骑虎难下,必须作出决策的情况。
这种博弈的最终结果,往往取决于参与人的理性态度,这是一种较难预知的博弈,也是非常觉的一种,孙子兵法上说“知已知彼,百战不殆”,也就是针对的这种博弈,但这种有一个例外,就是要求对方不清楚自己的情况。假如自己作对参与人之一,那么自己深知对方脾气的情况,就很容易知道对方最有可能采用的策略,自己自然也可以制订自己的策略,但这个天平倾斜的:对方如果是懦弱的理性思考者,那么,自己有利于自己,但如果对方是争强斗狠的角色,那么对自己肯定不利。再考虑到,如果对方考虑到自己的情况,也可以制订出相应的方针:假设对方知道自己是个狠角色的话,对方肯定是选择避让的。也就是说,知已知彼,一方面掌握对方多少信息固然重要,但如果知道了对方掌握自己多少信息,这也是可以进行利用的。
不过风险与赢率并存,没有任何完美的办法可以解决在无风险的情况下进行更高的赢率,一般参与的人态度,是风险中性,风险避规还是风险倾向,都可以决定一盘博弈的最终结果。
结论
在非合作博弈的情形下:
在囚徒困境中,因为仅存在一个博弈均衡,那么无论参与人是何种性质,最终都只有一种均衡。
在智猪博弈中,也是无论参与人的性质,最终都会造成,小猪无限等待的优势策略,大猪不得不拼命干事的最终结局。
在斗鸡博弈中,因为存在着了两个均衡,这就需要进行进一的提炼与分析,通过增加条件的手段,确定最终的均衡。