《博弈论的诡计》

 

1.走进博弈论:纷纷世上局如棋

博弈的目的:
  是争取利益,利益行程博弈的基础。经济学最基本的公设,就是经济人或是理性人的目的是收益最大化
博弈四要素
  1)两个或两个以上的参与者
  2)博弈要有参与各方争夺的资源或收益
  3)参与者有自己能够选择的策略
  4)参与者拥有一定量的信息
均衡:
  博弈论中重要的思想之一
  局中的每一个参与者都不可能因为单方面改变自己的策略而增加获益,于是各方为了自己利益的最大化而选择了各自的最优策略,并与其他对手达成了某种暂时的平衡。
纳什均衡:
  在对方策略确定的情况下,每个参与者的策略是最好的,此时没有人愿意先改变或主动改变自己的策略。也就是说,此时如果他改变策略,他的收益将会降低,所以没有人愿意先改变自己的策略。在纳什均衡点上,每一个理性的参与者都不会有单独改变策略的冲动
  所有人的选择综合到一块,不一定所有选择都能实现利益最大化,但能使所有人都达到最大化的选择
优势策略均衡:
  如果所有参与人都有优势策略,那么博弈将在所有参与人的优势策略基础上达到均衡,这种均衡称为优势策略均衡
  优势策略
    不管所有其他参与人选择什么策略,这一策略一定是该参与人的优势策略
  劣势策略:
    不论其他参与人采取什么策略,某参与人可能采取的策略中,对自己不利的策略
零和博弈:
  是一种完全对抗、强烈竞争的对策。在零和博弈的结局中,参与者的收益总和是零(或是某个常数),一个参与者的所得恰是另一个参与者的所失
负和博弈:
  两败俱伤的非零和博弈,我们称之为负和博弈
正和博弈
  双赢的博弈
 
博弈论的局限性
  博弈论的基本公设之一就是:人是理性的。是指合客观性,合逻辑性,即在人的意识中能以逻辑表达的思维意识。博弈论中所谓理性的人,指具有推理能力,目的是使自己的利益最大化的人
因为人类的经理和时间永远是有限的,人不可能具备完全理性,不可能掌握所有知识和信息。因此,现实的人在做决策时往往是有限理性的

2.囚徒困境

斯坦福大学客座教授的数学家塔克,构造的博弈模型:
共同作案偷窃的犯罪嫌疑人甲和乙被带进警局。警方对两人实行隔离关押和审讯,他们必须无法知道对方是招供还是抵赖。警方告知他们:如果其中一方与警方合作,招供所做违法之事,而对方抵赖,招供方无罪释放,另一方判刑10年;如果双方都招供,则个判5年;如果双方均不认罪,警方没有其他证据则无罪释放
旅行者困境:
演进版囚徒困境--两名旅行者提取行李的时候,发现花瓶摔坏了,于是向航空公司索赔。航空公司知道花瓶的价格八九十元,但不知道具体价格,于是,航空公司请两位旅客在一百元内写下花瓶的价格。两个两个人写的一样,则按照该金额赔偿;如果不一样,按照低价赔偿,并奖励讲真话的人2元,惩罚说谎的人2元。可是甲很聪明,他想:如果我少写一元,写成99,而已会写100,这样我将得到101,所以他准备写99。可是乙更加聪明,他预计到甲会算计自己而写99,于是他写了98。想不到甲又聪明一层,预计出乙要这样来坑他,准备写97...最后两人都写0
使对方陷入困境中:
当我们处于劣势中,可以创造一种困境,使对方陷入与你一样无法全身而退的困境,那么即便在这种困境出现之前,他本来拥有拿走你所有的一切的优势,此时,他也只能被迫进行理性的权衡,从而与你合作

3.人质困境:多个人的囚徒困境

多个参与者之间形成的囚徒困境又被称为人质困境。从两个囚犯到一群人质,能够更真实地反映个人理性与群体理性的巨大冲突。给猫栓铃铛的故事能够很好地说明这个理论:老鼠们想在猫脖子上栓一个铃铛,来保障自己的生命安全。问题在于,谁会愿意冒赔掉小命的风险去给猫拴上铃铛呢?
 
军备竞赛:
寡头竞赛:
卡特尔
  是一种正式的串谋行为,能使一个竞争性市场变成一个垄断市场,属于寡头市场的一个特例。以扩大整体利益为主要目标,在卡特尔内部将订立一系列的协议,来确定整个卡特尔的产量、产品价格,指定各企业的销售额及销售区域等。卡特尔常常是国际性的。例如欧佩克-卡特尔是产油国政府间的一个国际协定,在十多年间将世界石油价格提高到远高于本来会有的水平
 
与对手联合起来
  通过联合起来降低竞争激烈程度,各方都从囚徒困境中解脱出来,大家的结果都比原来更好
  比较常见的惨案“兔死狗烹”;“狡兔死,良狗烹;高鸟尽,良弓藏;敌国破,谋臣亡”;所以有些将军选择养敌自重
是竞争也是挟持
  类似的这种隐性的合作都是有条件的,那就是要展现自己随时可以报复的能力,以吓阻对手的背叛尝试。如果一方失去了对应的报复能力,均衡也将不复存在。
  比说说,可口可乐和百事可乐是饮料市场上的竞争对手,两家的市场竞争也可谓你死我活。但是多年来,这种局面让每一家都赚了个盆满钵满,而且从来没有因为竞争而使第三者异军突起。这里面的真正原因就是在于:这两家饮料市场的龙头企业,实际上形成了一种有合作的竞争关系。它们真正的目标是消费者,以及那些虎视眈眈的后起之秀。只要有企业想进入碳酸饮料市场,它们就必然展开一场心照不宣的攻势,让挑战者知难而退,或者一败涂地
退出权保证合作
  举个例子:农民合作社,“入社自愿、退社自由”。在这种政策前提下,当合作社里有越来越多的人不努力劳动,想搭积极劳动的人的‘便车’时,生产率就会下降,这时那些努力劳动的人就会发现,加入合作社的收益还不如自己单干多,就会退社。这种退社的自己有,一方面对努力劳动的人是一种自我权利的保护,另一方面对那些偷懒的人也是一种实质性的威胁,实际上有效防止了社员偷懒
多边关系的启示
  在上面的分析中,都是从困境中的囚徒或者人质的角度进行的,解决问题的策略也是提供给他们的。囚徒联起手来,也就意味着他们会建立攻守同盟,不必进行两败俱伤的招供了。那么警察又该如何避免不利局面呢?-- 制造某种强大的压力迫使其合作,这种压力对囚徒困境中的每一方都有效果
  举个例子:西点军校的荣誉准则之一:该校的考试无人监考,作弊属于重大过失,作弊者会被立即开除,发现作弊而未能及时告发同样开除
重视利用圈子来解决问题,把与对手的博弈变成多边的。
  举个例子:一个萍水相逢的人可能会骗走你的一千元钱,但是在一个朋友圈中,名声和信誉是跟长期利益直接挂钩的。某个圈中人如果骗了你一千元钱,也就意味着会受到一群人不会再借给他的惩罚。
 
新词汇哈哈哈哈: 俯拾皆星

4.重复博弈:天长地久的聪明策略

没有未来必然背叛
  对未来的逾期是影响我们行为的重要因素
  一次性的买卖,往往发生在双方以后不再有买卖机会的时候,双方都竭尽全力谋取一次性的更高利益,为此不惜借助于强制和欺骗。而吸引回头客的买卖,便是通过薄利行为,使得双方的合作能够持续进行下去
带剑的契约才有效
  从博弈的角度看,法律就是通过第三方实施的行为规范,其功能首先是改变当事人的选择空间,其次是改变人们的信念或对他人的行为逾期,从而改变博弈的结果
宽恕带来更多背叛
  如果在博弈一开始的时候就能做出可信的报复威胁,使背叛者认为最后一定不被宽恕,反而会达到不被对手背叛的效果
一个知识点:贫穷往往使人的自制力降低
假装不知道有尽头
  有限次数的囚徒困境,情况不同于无限次的囚徒困境的重复博弈。当临近博弈的终点时,采取不合作策略的可能性加大。如果参与人以前的所有策略均为合作策略,并且被告知下一次博弈是最后一次,那么他肯定采取不合作的策略
  合作的基础与其说是信任和友谊,不如说是关系的可持续性,只有当双方的关系有着值得重视的未来,才能保证稳定持续的合作
用道德保证均衡
  带剑的契约对于保证合作关系是最有效的,但是在很多情况下,我们根本找不到剑也就是法律来保证合作,可以用‘道德’(也可以理解是一种社会上普遍任务的约定)来约束。
  西方伦理学把人类的道德准则分为四种:金律、银律、铜律、铁律
    金律(作为者):你要别人怎样对待你,你就怎样对待别人
    银律(退让者):己所不欲勿施于人
    铜律(报复者):对人怎样对待你,你就怎样对待别人
    铁律(进攻者):在别人进攻你之前,首先进攻别人
  经济学家卡尔萨根认为,铜律更优越,能够为人类道德提供进化论的基础
  
  在日常的交际中,单纯依靠对手的道德自律来达成合作,是不保险的。我们可以通过对道德因素的考虑,把交际变成长期的、多边的,从而形成诚实守信的动力与压力
小步慢行的费边主义
  正是因为重复博弈能够给对方带来合作的压力,因此,我们必须学会有意识地创造重复博弈的局面
  费边战术(博弈论):
    把一次决战变成长期博弈的策略
  原意:
    费边-马克西姆斯,罗马执政官。当时罗马与迦太基战争中,迦太基所向披靡。费边知道迦太基军队远离本土,从北非的补给线又太长,不可能持久作战。因此,费边采取了避其锋芒、稳步渐进、小规模进攻的策略,不与迦太基正面作战而是利用地形优势在山区与敌人周旋,同时不断骚扰南欧,干扰敌人补给线,最终赢得了胜利,这种缓步前进的战术就被称为费边战术

5.一报还一报:出来混迟早要还的

一报还一报
  对另一方的背叛行为进行惩罚
再一再二不再三
  合作中可能会出现误会。一方对另一方的背叛行为进行惩罚,从而引起连锁反应。由此将形成一个循环,惩罚与报复就这样持续下去。从这个角度来说,一报还一报策略有两种缺陷
    1)更多的仇恨容易被激发出来
    2)缺少一个宣布报复‘到此为止’的方法
  因此,不要对你看见的每一次背叛都进行惩罚,而要采取再一再二不再三策略
输掉战役赢得战争
  也许从某一次合作的局部看是吃亏的,但是这些合作对全局发展起到了极大的作用,那么这种亏是值得的。

6.猎鹿博弈:走上集体优化之路

帕累托效率准则:
  经济的效率体现于配置社会资源以改善人们的境况,主要看资源是否已经被充分利用。如果资源已经被充分利用,要想再次改善任何人都必须损害别的人了,这时候就说已经实现了帕累托效率
赢家通吃并不理性
  要想形成合作,能力较差的猎人乙的所得,至少要多于他独自打猎的收益,否则他就没有合作的动机。为了改善双方的境况,就需要能力较强的猎人甲又全局眼光,把自己的一部分所得让给乙。这看上去似乎有点不公平,但是换来的合作对双方的好处,是不言自明的
  如果坐视此种现象发生甚至有意无意地加以助长,囚徒困境就会普遍发生,阶层固化的社会就会丧失最基本的互信,资源就会投入无效益的地方,从而降低全社会的福利水平,大家一齐滑向一种无效率的状态
共同付出才能共赢
  公共资源的悲剧
    这一理论最初是由美国生态学家格雷特哈定发表的文章《共有地悲剧》中提出来的,因此又被称为‘哈定悲剧’
    文章讲了一个关于牧民与草地的故事,说的是当草地像牧民完全放开时,每个牧民都想多养一头牛,因为多养一头牛增加的收入大于其成本,显然是游客可图的。尽管因为平均草量下降,增加一头牛可能使这个草地的牛吃不饱,单位收益下降,但对于单个牧民来说,他增加一头牛是有利的,最终草地将被过度放牧,导致所有的牛都饿死
  哈定的结论:世界各地的人民必须意识到,有必要限制个人做出这些选择的自由,接受某种‘一致赞成的共同约束’
  如果社会上每一个人都追求自己的最大利益,毁灭将成为大家不能逃脱的命运
  防止共用土地悲剧的办法有两种:1)制度上的,建立中心化的权利机构 2)道德约束与非中心化的奖惩联系在一起

7.酒吧博弈:成功者的少数派策略

动态群体博弈:
  假设小镇上有一百人,每个周末要决定是去酒吧活动还是待在家里。这个小镇上只有一家酒吧,接待60人时服务于最好。第一次一百人中的大多数去了酒吧,导致酒吧爆满,体验很糟糕,那些选择没去的人反而庆幸。第二次,人们根据上一次的经验,人多得受不了,决定不去了,结果多数人决定不去,这次去的人很少,享受了一次高质量的服务。
  阿瑟教授通过计算机模拟和对真实人群的考察得出两种结果
    1)计算机模型:经过一段时间后,去酒吧的平均人数很快达到60,预测者自发地形成一个生态稳定系统
    2)真实人群:有规律的波浪形态
  酒吧博弈的研究,对我们的启示
    1)从一个非线性的系统的整体来说,其变化往往是不可预测的
    2)对身处于一个混沌系统中的个体来说,在无法预测的过程中采取恰当的策略,往往可以趋吉避凶。在这样的策略中,少数派策略是值得我们重点关注的
一加一未必等于二
  举凡未经协调的一系列行动,都有可能相互影响,造成让全体行动者一致感到遗憾的结果。而当结果出现以后,我们才恍然发现:不知从哪一个行动开始,加法变成了减法,整个进程在不知不觉中偏离了目标
混沌世界的临界点
  自组织临界理论:
沙子一粒一粒落下,行程逐渐增高的一堆,借助慢速录像和电脑模拟,精确地计算在沙堆顶部每落一粒沙会连带多少沙粒移动。初始阶段,落下的沙粒对沙堆整体影响很小。但是当沙堆增高到一定程度之后,即使再落下一粒沙也可能导致整个沙堆发生坍塌
谁颠覆了失去平衡

 

  一个白人、黑人混住的社区。曲线右上方表示假如一个社区变成了完全的种族隔离,即全是白人,那么下一个迁入的住户就很有哦可能是白人。假如种族混合比例降到白人有90%,下一个迁入的住户是白人的概率仍然很高。假如种族混合比例沿着白人减少这个方向继续变化,那么下一个迁入的住户是白人的概率就会急剧下降。最后,随着白人的实际比例降至0,这个社区就变成了另外一种极端,那么下一个迁入的住户大概率是黑人
  在这种情况下,只有当地人口种族混合比例恰好等于新迁入住户种族混合比例时,才会出现均衡,并且保持稳定。然而,这种情况很难出现,社会动力将一直推动整个社区向一个极端的均衡移动。这一现象,称为‘颠覆’
策略的多米诺骨牌
  秃头论证、蚂蚁效应
  千万不要轻视了微小的力量,而要坚持将一丝一毫的力量积累成最后的成功
成功属于‘少数派’

8.枪手博弈:用策略弥补实力的不足

  在多人博弈中常常由于复杂关系的存在,而出现出人意料的结局,一位参与者最后能否胜出,不仅仅取决于自己的实力,更取决于实力对比关系以及各方的策略
谁能最后活下来
  三个反目成仇的快枪手,街道不期而遇,每个人的手里都握了把枪。三个抢手对于彼此间的实力对比都了如指掌:老大枪法精准,十发八中;老大枪法不错,十发六中;老三枪法拙劣,十发四中。假如三人同时开枪,谁活下来的几率大一点?答案是老三。如果换一种玩法:三个人轮流开枪,谁的机会更大?如果顺序是老大、老二、老三,毫无疑问,老大会先向老二开枪,如果老二阵亡,那么轮到老三开枪,赢面还有40%;如果老二没有阵亡,也必然向老大开枪,不管怎样,老三的成功概率都是很大的。
  如果首先开枪的是老三,他该怎么办?老三的最佳策略是乱开一枪,只要他不打中任务对手,不破坏这个局面,他总是有利可图的
同时出招的策略
  假如你有一个优势策略,请照办。不要担心你的对手会怎么做。假如你没有一个优势策略,但你的对手有,那么就当他一定会采用这个优势策略,相应的,你要选择你自己最好的做法
相继出招的策略
  每一位参与者的策略都必须基于对另一方策略的预测
三方博弈的联盟
  博弈的结果在很大程度取决于参与者的人数。参与的人越多越好,即便在同一个博弈里也是如此。但是,两个敌对国家难以和平共处、三个敌对国家就能恢复稳定局面的结论,并不意味着若有四个敌对国家就更好
进攻方向的选择
  总体处于弱势的参与者,可以在某个局部领域集中自己所有的资源并加以整合,造成在细分领域的优势,从而成为竞争的赢家
置身事外的智慧
  即使是枪手之间的博弈,在枪弹横飞之前甚至之中,也仍然会出现某种回旋空间。对尚未加入战团的一方来说,越是保持自己的含糊态度,保持一种对另外两方的威胁态势,其地位越重要。
置身事外不过是一种博弈手段,其目标是为了在冲突的最初阶段更好地保护自己,并且在将来挺身入局的时候,能够占据更为游刃有余的地位,进而更好地掌握这个局面

9.智猪博弈:事半功倍的顺风车

  假设猪圈里有两头猪同在一个石槽里进食,一头大猪,一头小猪。猪圈一头安装了一块控制饲料供应的踩踏板,另一头是饲料出口。猪踩一下踏板,另一边就会有相当于10份饲料进槽,但是踩踏板以及跑到食槽所需要付出的劳动,相当于消耗2份饲料。
  两头猪可以选择的策略有两个:自己去踩踏板或等待另一头猪去踩踏板。假如小猪踩踏板,大猪可以吃到9份饲料,小猪只能吃到1份饲料;若大猪踩踏板,小猪能吃到4份饲料,大猪吃到6份饲料;若两猪同事踩踏板,同时跑向食槽,大猪吃到7份饲料,小猪吃到4份饲料;若两头猪都选择等待,那就都吃不到饲料
  这个博弈的均衡解是大猪踩踏板,小猪等待。我们是按照“重复剔除严格劣势策略”的思路进行的:首先找出某个参与人的严格劣势策略,将它剔除,重新构造一个不包括一剔除策略的新博弈;继续剔除这个新的博弈中某一个参与人的严格劣势策略(是任一个人还是另一个人的劣势策略???);重复进行这一过程,直到剩下唯一的参与人策略组合为止。这个博弈的均衡解称为“重复剔除的占有策略均衡”
  小猪踩踏板只能吃到1份,不踩踏板反而能吃到4份,对小猪二样,不踩是最好的选择。由于小猪有等待这个优势策略,大猪只剩下了两个选择:等待就吃不到,踩踏板得到4份,等待则是大猪的劣势策略,以此类推
  智猪博弈与囚徒困境的不同之处在于:囚徒困境中的犯罪嫌疑人都有自己的严格优势策略,而智猪博弈中,只有小猪有;
  智猪博弈模型可以解释为什么占有更多资源者,必须承担更多的义务
比比皆是的智猪
  在许多国家内部,一个大政党和一个或多个小政党必须组成一个联合政府。大政党一般愿意扮演负责合作的那一方,委曲求全,确保联盟不会瓦解;而小政党则坚持它们自己的特殊要求,选择通常偏向极端的道路
猪圈里的跟随策略
  轮盘赌:决赛前,第一名巴里手里有了700的筹码,独占鳌头,第二名lily拥有300。轮盘赌的规则:输赢取决于轮盘停止转动时小球落在什么地方。典型的情况是,轮盘上刻着0~36共37个格子。可以压落在奇数or偶数,赔率是一赔一,比如一元变两元,胜率是18/37;可以压3的倍数,赔率是三赔一,胜率是12/37。
  在这种玩法下,即便lily全部压奇偶数赢了,也依然会输给巴里,因此她只能选择风险更大的,3的倍数。如果她赢了,她的300元就会变成900元,但她取胜的机会只有12/37。加入lily已下注。那么巴里应该怎么办?巴里应该跟随lily的做法,同样把300元押在3倍上。这么做他可以确保领先对方400元。相反,如果巴里不押3的倍数,那么他有一半的机会以大比数胜出,同时也有一半的机会输掉。
  对于lily来说,她唯一的希望在于巴里先赌。
占优势时更应保守
  划船比赛,领先的一方通常会选择跟随落后一方的策略,用来保证绝对的胜出,即便落后一方的策略可能比较低劣
局面不利要冒险换牌
  冒险策略越早越好
管理中要杜绝搭便车
  拔河研究:三个人拔河的力量相当于一个人的2.5倍,而八个人的力量还不到一个人的4倍。这就表明团队驾校有时是小于个人绩效总和的
  团队规模越大,成员个体的生产力确越低。其原因就是当团队中的个人贡献无法衡量时,人人都想称为团体中的小猪,从而表现出强烈的投机主义倾向,积极性不同程度地下降
  在管理中,为使资源最有效配置,规则不应激励搭便车的“小猪策略”,合理设置游戏规则的核心指标,提高小猪的投机成本

10.警察与小偷博弈:猜猜猜与变变变

  镇上只有一名警察,他要负责整个镇的治安。现在我们假定,小镇的一头有一家酒馆,另一头有一家银行。再假定该地有一个小偷,要实施偷盗。因为分身乏术,警察一次只能在一个地方巡逻;而小偷也只能去一个地方。若警察选择了小偷偷盗的地方巡逻,就能把小偷抓住;而小偷选择了没有警察巡逻的地方偷盗,就能够偷盗成功。假定银行需要保护的财产价格为2w,酒馆1w,警察怎么巡逻才能使效果更好?
  警察最好的策略是,抽签。因为银行的价值是酒馆的两倍,所以用两个签代表银行,比如抽到1号,2号则去银行,抽到3号去酒馆。在这种情况下,小偷的最好策略也是抽签
  这类博弈与囚徒困境博弈有一个很大的差别,那就是没有纯策略纳什均衡点,只有混合策略纳什均衡点。这个混合策略均衡点下的策略是每个参与者的最优混合策略
  纯策略:参与者在他策略空间中选取唯一确定的策略,是参与者一次性选取的;混合策略:参与者在各种备选策略中采取随机方式选取的,参与者可以改变他的策略,而使之满足一定的概率
当电话打到一半时
变动收益博弈:
  每一种真实的博弈形式,总是受到一些微小的随机波动因素影响。在一个标准博弈模型中,这些影响表现为微小的独立连续随机变量,每个局中人的每一策略均对应一个。这些随机变量的具体取值仅为局中人所知,这种知识即成为私有信息;海萨尼把这称为变动收益博弈
  局中人只是表面上以混合策略进行博弈,但是实际上,他们是在各种略为不同的博弈情形中以纯策略进行博弈的。
  谢林把在众多的均衡中实际更可能发生的均衡称为聚点,并指出,文化、宗教、社会规范、和历史传统等有助于聚点的形成。博弈分析的目的是为了预测均衡,而均衡的多重性将使博弈分析的价值大打折扣,而聚点概念则可以在一定程度上缓解上述矛盾
最大最小定理
  数学家冯诺依曼创立,是博弈论的第一个里程碑。这一定理指出,在二人零和博弈中,参与者的利益严格相反,每个参与者尽量使对手的最大收益最小化,而他的对手则努力使自己的最小收益最大化... 这里看不懂
  总结:采取混合或者随机策略,并不等同于毫无策略地瞎出,这里面仍然有很强的策略必要性。基本要点在于,运用偶然性,防止别人利用你的有规则行为占你的便宜
不可预测的算计
  假如双方都采用一种难以预见或者多管齐下的混合策略,那么狠可能会降低竞争的惨烈程度。总而言之,实时多管齐下的随机策略,诀窍在于不可预测性
纯粹的随机策略
  居住在加拿大东北部的印第安人,每天都要面对一个问题:选择朝哪个方向出发去寻找猎物。他们的做法是:将一块龟甲放在火上炙烤,裂痕的走向就是方向
  印第安人无意中运用了波特所说的“长期战略”。按通常的做法,如果头一天满载而归,那么第二天就应该再到那个地方去狩猎。在一定时间内,他们的生产可能会出现快速增长,但正如美国学者彼得圣吉所说,有许多快速增长常常是在缺乏系统思考、掠夺性利用资源的情况下取得的,其增长的曲线明显呈抛物线状,在迅速到达顶点后将迅速下滑
  很多东西根本是不可预测的,与其让主观猜测干扰我们的决策,不如采取纯粹的随机方式
随机抽查的策略
  在生活中,抽查作为监管方的一种随机策略,能够以较低的监管成本促使人们遵守规定。
猜不透的虚张声势
  稳健是博弈的要务,想赢别人一定要先把赢得每一个环节都考虑周到,不能让对手发现任何真实的规律

11.斗鸡博弈:让对手知难而退

斗鸡博弈:
  势均力敌的两只斗鸡,如果斗鸡甲退下来,而斗鸡乙没有退,那么乙胜利,甲很丢面子;如果乙也退下来,那么双方打个平手;如果两只斗鸡都前进,那么会两败俱伤
  两个强者的对抗冲突,如何能让自己占据优势,得到最大利益,确保损失最小呢?
  在种种博弈中,只有一方先撤退,才能双方获利。特别是占据优势的一方,如果具有这种以退求进的智慧,提供给对方回旋的余地,也将给自己带来胜利,那么双方都会成为利益的获得者。哪一只斗鸡进,哪一只斗鸡退,不是谁先说就听谁的,而是要通过实力的比较以及双方策略的运用。在策略的运用过程中,很重要的工具就是承诺和威胁。可以在保护自己的前提下有效地影响对手的行动,不战而屈人之兵
攻击的“仪式化”
  同物种间的相互攻击是有一定积极功能的;胜者可以获得更多的异性和食物,从种群的范围来看,争斗也可以在客观上使个体的空间分布更为合理。
  动物最主要的手段,是将同种间的攻击变成“仪式化”行为。两头公牛交锋时,各自用其巨大的牛角将地皮铲的尘土飞扬,以显示自己的力量。弱势者往往从这一仪式中认识到自己的弱势,及时退却,而强势者从不追赶。哺乳动物中没有嗜杀同类的现象
愣的也怕不要命的
  不可否认,在实力相对较弱却又不得不卷入关系自身生死存亡的博弈时,实力弱的一方胆量过人,也许还有胜的可能,如果胆量也弱,则必败无疑
不计后果的战略家
  边缘策略:创造并控制发生灾难的风险,借以迫使对手让步
通过浪费来赢利
  广告对销售的促进价值并没有那么大,也就是说,请明星并不值得花那么多钱。然而就是要通过这样人人皆知的浪费,来展示自己争夺市场的决心,用这样的决心来吓退对手
让老板加薪的博弈
  哪一方前进,不是由两只斗鸡的主观愿望决定的,而是由双方的实力预测所决定的。当双方都无法预测双方实力的强弱时,那就只有通过试探。而在试探的时候,要有分寸,更要有勇气

12.协和谬误:欲罢不能的困局

协和谬误:
  英法两国政府签署协议合作研制协和式超音速客机,项目开展不久,两国政府发现:继续投资开发这样的机型,花费会急剧增加,但这样的设计定位能否适应市场还不知道,然而停止研制也是可怕的,因为以前的投资将付诸东流。协和式飞机正式投入运营时,投资研究超过了8亿英镑,超预算6倍。实际上,因耗油大和维修成本太高也不适应市场竞争,英法政府为此蒙受了很大的损失
沉没成本
  凡是你在正式完成任务之前投入的成本,无论是金钱还是时间和精力,一旦任务不成功,就会白白损失掉,成为沉没成本
  从理性的角度来说,沉没成本不应该影响我们的决策,更不应该影响我们的生活。然而,我们常常由于想挽回已经无法收回的沉没成本,而做出很多不理性的行为,从而陷入沉没成本的泥潭。有时候,这种努力本身反而会让你越陷越深,更加无法自拔
认赌服输的智慧
  无论沉没成本是由自己还是别人的原因造成的,既然已经无可挽回,那么我们不应纠缠不休,而应该当什么也没发生,尝试以一种归零的心态来进行下一步的决策。那么具体来说,怎么才能让自己摆脱沉没成本的羁绊呢?一个比较明智的做法是,在一些事情的沉没成本变得不可接受之前,及时放弃它。具体来说,一是在进行一项工作之前的决策要慎重,要在掌握了足够信息的情况下对可能的收益与损失进行全面的评估;二是沉没成本一旦形成,就必须要承认现实,认赔服输,避免造成更大的损失
  在很多情况下,我们就像伊索寓言里的那只狐狸,想尽了办法,付出了努力,却由于客观原因最终没有吃到那串葡萄。这时,即使坐在葡萄架下哭上一天,暴跳如雷也是无济于事的,反而不如用一句“这串葡萄一定是酸的,让馋嘴的麻雀去吃吧”来安慰自己,求得心理上的平衡。这种调整期望的落差,转而接受柠檬虽酸却也别有滋味的事实,很有点据于儒、依于道而逃于禅的味道,却不至于伤害了自尊与自信。因此我们可以说,酸葡萄心理不失为一种让我们摆脱沉没成本的困扰,接受现实的好方法,而且可以消除心理紧张,缓和心理气氛,减少因产生攻击性冲动和攻击行为而造成更大的损失和浪费。从这个意义上来讲,它又不失为一种时间管理的方法。事实上确实如此,生活中最大的效率其实在于:真正有勇气来改变可以改变的事情,有度量接受不可改变的事情,有智慧来分辨两者的不同。
覆水难收不必再收
强迫自己去成功
  当你面对一堵很难攀越的高墙时,不妨先把帽子扔过墙去。这意味着你别无选择,为了找回帽子,必须翻越这堵高墙。正是面临这种无退路的境地,人们才会集中精力奋勇向前。在当今社会激烈的竞争中争得属于自己的位置,不给自己留退路,从某种意义上讲,也是给自己一个向梦想冲刺的机会。

13.蜈蚣博弈:从终点出发的思维

倒推法
  围棋是对弈双方按照一先一后次序行动的博弈。对于一人一步的相继行动的博弈,每个参与者都必须向前展望或预期,估计对手的意图,从而倒后推理,决定自己这一步应该怎么走。也就是说,在相继行动的博弈里,存在一条线性思维链:假如我这么做,我的对手可以那么做,反过来我应该这样应对……这种博弈通过描绘博弈树进行研究。只要遵循“向前展望,倒后推理”的法则,就能找出最佳行动方式。这种方法在博弈论上有一个名字,叫作“倒推法”。
日常生活中的博弈策略 人生的倒后推理
  当我们在为手头的工作忙得焦头烂额的时候,一定要停下来,静静地问一下自己:五年后你最希望得到什么?你现在所做的工作有助于你达到这个目标吗?如果不能,你为什么要做?如果无法回答这些问题,那么需要检讨自己的价值观,想象一下自己想要成为什么样的人。
从墓志铭想人生
  什么样的选择决定什么样的生活,我们今天的生活是由三年前所做出的选择决定的;而今天我们的抉择,却不仅将决定我们三年后的生活,而且会影响我们最终离开人世时的样子
  伍迪·艾伦曾经说过,生活中90%的时间只是在混日子。大多数人的生活层次只停留在为吃饭而吃,为工作而工作,为回家而回家。他们从一个地方逛到另一个地方,事情做完一件又一件,好像做了很多事,却很少有时间从事自己真正想完成的目标。就这样,一直到老死。很多人临到自己垂垂老矣的时候,才发现自己虚度了大半生,剩余的日子又在病痛中一点一点地流逝。
  那么,我们要怎样度过一生,才能不算虚度呢?回答这个问题,可以帮助我们把所有生活层面的东西过滤,提炼出我们最根本的人生目标,发掘我们心底最根深蒂固的价值观,决定我们人生目标的最核心部分。
蜈蚣博弈的悖论
  一个人打算向邻居借斧子,又担心邻居不肯借给他,他在前往邻居家的路上不断胡思乱想。“如果他说自己正在用怎么办?”“要是他说找不到怎么办?”想到这些,这人自然对邻居感到不满。“邻里之间应该和睦相处,他为什么不肯借给我?”“假如他向我借东西,我一定会很高兴地借给他。”“可是他不肯借斧头给我,我对他也不应该太客气……”这人一路上越想越生气,等到敲开邻居的门后,他说的不是“请把你的斧子借给我用一下吧”,而是张嘴说道:“留着你的破斧子吧,我才不稀罕你的东西!”
  从上面这个笑话中,我们可以想象一些喜欢以己度人者在生活中遇到的尴尬。但是笑过之后,我们却发现,这个借斧头的人所运用的思维方法,居然有着倒推法的影子。难道倒推法有什么问题吗?答案是肯定的,这种悖论在博弈论中被称为“蜈蚣博弈悖论”。很多学者已经用科学的方法推导出:倒推法是分析完全且完美信息下的动态博弈的有用工具,也符合我们的直觉,但在某种情况下却存在着无法解释的缺陷。
  倒推法悖论其实是源于其适用范围的问题,即倒推法只是在一定的条件下和一定的范围内有效。不恰当地运用倒推法,就会在一些博弈问题中造成矛盾和悖论。不能因为倒推法的预测与实际有一些不符,就否定它在分析和预测行为中的可靠性。只要分析的问题符合它成立的条件和要求,倒推法仍然是一种分析动态博弈的有效方法。

14.分蛋糕博弈:革命就是讨价还价

创造生活的艺术
  爱尔兰剧作家萧伯纳曾经说,经济学是一门最大限度创造生活的艺术。而在很多情况下,这种创造的基础就是讨价还价,或者说,讨价还价是创造生活艺术的一种具体方法。
蛋糕在融化
  桌子上放着的是一个冰激凌蛋糕,两个孩子在就分配方式讨价还价的时候,蛋糕在不停地融化。假设每提出一个建议或反建议,蛋糕都会朝零的方向缩小同样大小。这时,讨价还价的第一轮由A提出要求,B接受条件则谈判成功,若B不接收条件进入第二轮;第二轮由B提出分蛋糕的条件,A接受则谈判成功,A不接受,于是蛋糕融化,谈判失败。
  我们再来看看当谈判有三个阶段时会是什么样的结果。为了便于论述,不妨假设这个时候,蛋糕每过一个讨价还价的轮次就融化1/3,到最后一轮结束时,由于过了两个谈判的阶段,蛋糕全部融化。动态博弈一般都是采用倒推法,从最后一个阶段看,即使谈判成功,A最多只能得到剩下的1/3个蛋糕。B知道这一点,因此在第二阶段轮到自己提要求时,他要求两人平分第一轮剩下的2/3个蛋糕。A在第一轮时就知道B第二轮的想法,于是在第一阶段刚开始提要求时,直接答应给B蛋糕的1/3大小,B知道即使不同意这个条件,进入第二轮也一样是最多得到1/3个蛋糕,到了第三轮几乎分不到蛋糕,因此B一定会接受这个初始条件。这个三阶段的分蛋糕谈判最终的结果是B分得1/3个蛋糕,A分得2/3个蛋糕。
煮了吃还是蒸了吃
  在现实生活的谈判中,任何讨价还价的过程都不能无限制地进行。因为讨价还价的过程总是需要成本的,在经济学上这个成本称之为“交易成本”。就如同冰激凌蛋糕会随着两个孩子之间的讨价还价过程而融化,不妨仅简单地认为被融化的那部分蛋糕就是这个讨价还价过程的交易成本。
  从数学上可以证明,分蛋糕博弈只要博弈阶段是双数时,双方分得的蛋糕将会是一样大小,博弈阶段是单数时,后提要求的博弈者所得到的收益一定会好于先提出要求的博弈者,然而随着阶段数的增加,双方收益之间的差距会越来越小,每个人分得的蛋糕将越来越接近于一半。也就是说,向前展望,倒后推理的原理,可能在整个过程开始之前就已经确定了最后结果。
坚定不移的策略
  博尔韦尔策略,是指提出合理的条件以后就拒绝再讨价还价的策略,也就是提出一个“不买拉倒”的价格。
单数与双数的优势
  ???没看懂
减少你的等待成本
  贴现率:双方不耐心的冲动指数。至于讨价还价的博弈中,最终得出的协议,会把较大份额归属于更加有耐心的一方。讨价还价的博弈把贴现率看作是耐心的度量,以此平衡现在和未来。在这个过程中,各方必须猜测对方的等待成本。由于等待成本较低的一方能占上风,各方符合自身利益的做法,就是宣称自己的等待成本很低。
保护还价的能力
  那就是一定要在自己的讨价还价能力仍然存在的时候,充分利用。换句话说,如果你是买家,就要争取先验货或者试用再付款,如果你是卖家,应该争取对方先支付部分款项再正式交货。
外部机会的算计
  在博弈中,一个参与者的外部机会越好,他能够从讨价还价当中得到的份额也就越多。但是与此同时,他还必须注意到,真正影响大局的,是他的外部机会与他的对手的外部机会的相对关系。
偷梁换柱来还价
  梁和柱在房屋建筑中,就像所有事物的关键与精华部件一样,起着巨大而不可替代的作用。也正因如此,如果在博弈中运用某种策略,暗中更换对方所追求的利益的关键部分,就可以巧妙地改变事物的性质和内部结构,轻而易举地得到对方本来会锱铢必较的关键利益。
  谈判者应该将所有有关共同利益的问题放在一起进行讨价还价,利用各方对这些问题的重视程度的不同,达成对大家来说都更好的结果。

第15章 鹰鸽博弈:让事业进入良性循环

办公室里的高纸板
  ESS,即进化稳定策略(Evolutionarily Stable Strategy),是指种群的大部分成员所采用某种策略,其好处为其他策略所比不上的。换句话讲,对个体来说,最好的策略取决于种群的大多数成员在做什么。由于种群的其余部分也是由个体组成的,而它们都力图最大限度地扩大其各自的成就,因而能够持续存在的必将是这样一种策略:它一旦形成,任何举止异常的个体的策略都不可能与之比拟。
  在环境的一次大变动之后,种群内可能出现一个短暂的进化上的不稳定阶段,甚至可能出现波动。但是一种ESS一旦确立下来,就可以稳定下来:偏离ESS的行为将要受到自然选择的惩罚。所以,我们与其相信出淤泥而不染,倒不如相信近墨者黑近朱者赤才是符合进化规律的!
随大溜的理性一面
  群体中的危机有自我实现的机制,在预警信息出现的时候,不要认为自己比别人更高尚、更有远见,也不要忌讳自己是不是“随大溜”的毛毛虫。
栅栏上的路径依赖
  路径依赖:人们一旦确定了一种选择,就会对这种选择产生依赖性;这种选择本身也具有发展的惯性,具有自我积累放大效应,从而不断强化这种初始选择。
胜出的未必是好的
  在很多情况下,更好的方案一定会被采纳。如果一个方案已经制定了很长时间,现在环境发生了变化,虽然另一个方案更可取,但这时要想改革尤其不容易。
严厉才能立竿见影
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
posted @ 2024-05-27 15:23  情歌z  阅读(15)  评论(0编辑  收藏  举报