博弈论——机制设计理论（八）

博弈论（GameTheory）是一种研究人类决策行为的数学方法，用于研究多个参与者之间的交互和策略选择。博弈的最高境界是双赢，它是参与人之间的一种竞赛，规则在其中就难以避免（博弈不一定是要赢对方，规则决定了博弈的结果）。规则的表现形式有很多种，世俗民约、契约合同、道德观念、法律规范、社会制度等等，其中最重要的有两个方面：道德与法律。机制设计（MechanismDesign）则是博弈论的应用，用于构建合理的市场机制或决策规则，旨在引导参与者按照规则进行交互，在最优化的情况下获得稳定的收益。2007年的诺贝尔奖经济学奖颁发给赫维奇(Hurwicz)、马士金(Maskin)、迈尔森(Myerson)三位经济学家，以表扬他们在发展“机制设计” 这个领域所作出的贡献。尽管对一般读者来说，机制设计是个颇为陌生的经济学概念，但是其经济学研究影响之大，实际应用之无处不在。

一、案例导引

案例1：二人分饼
有两个旅人，一路跋山涉水，带的干粮都吃完了，只剩下一张饼。当饥肠辘辘的两个人面对一张饼时，怎么分才最公平？很多人会想，这还不简单，找个公证人呗。于是，两个旅人找到一位裁缝，请他来分饼。可临到裁缝准备分饼时，旅人又犹豫了，万一裁缝分得不公平怎么办？于是他们请来隔壁的木匠来监督裁缝。可木匠到来后，旅人又犹豫了，万一木匠也不公平怎么办？于是他们又请来隔壁的隔壁的篾匠来监督木匠。可篾匠到来后，裁缝手上的刀无论怎么比划，两个旅人和木匠、篾匠都大呼小叫，认为分得不公平。于是，他们又去请隔壁的隔壁的隔壁的铁匠……
大家觉得好笑吗？可现实当中，这样的黑色幽默每天都在发生。许多企业一谈到加强管理，就是这样不断地加人加岗，以加强监管。先找个监督人，再找个监督人的监督人，然后找个监督人的监督人的监督人……
回到“二人分饼”的故事中，最后众人闹到县官那里，县官听了，哈哈大笑，说：“这还不简单，你先切，我先拿，天下太平。”在这种简单规则中，切饼的人，如果自作聪明，把饼分得一半大一半小，当他发现留给自己的是小的那一块时，只能自个儿扇自个儿的嘴巴子；挑饼的人，如果发现他那半拉夹的是萝卜干，另外的半拉里有鲍鱼海参，恨得直咬牙，嘴上还得自吹是我让你一马。

案例2：七人分粥
现在有 $N（N>2）$ 人分粥，请你设计一个程序，使得他们当中的每一个人都觉得公平……
七个和尚住在一间没有香火的破庙里。为了维持生计，他们自力更生，开荒种地。和尚们早出晚归，每天早上煮上一锅粥，晚上回来再吃，一天只吃一顿，自然谁都想多吃点。他们既没有尺子，也没有量杯，更没有秤，于是便想通过设计制度的办法来解决每天的吃饭问题——如何公平地分食一锅粥？
大家发挥聪明才智，试验了很多办法，形成了以下种种规则：
规则1：选举一名信得过的人负责分粥。但时间一长大家发现，分粥的人自己碗里的粥最多，换一个人也是如此。大家认为这不行，“好人”也变成了“坏人”，于是奋起废除了这一滋生腐化的制度。
规则2：选举一名品行端正的人主持分粥，再选举一名德高望重的人来监督分粥。起初还比较公平，但到后来，分粥人与监督人从权力制约走向“权力合作”，这两人分到的粥最多，制度再次失败。
规则3：选举一个四人分粥委员会和一个三人监督委员会，实行大民主。可问题也来了，所有的人都到齐了才能开始分粥，每个人的眼神又各有千秋：甲是桃花眼，看啥都顺眼，咋看都是一样多；乙是斗鸡眼，看啥都不顺眼，咋看就是不一样多；丙是蛤蟆眼，“蛤蟆看绿豆，越看越顺眼”，开始看不一样多，看久了看顺溜了，一样多嘛。一番争吵下来，即使粥偶尔能分成功，也全是凉的，制度效率太低。
规则4：谁也信不过，干脆大家每人一天，轮流坐庄主持分粥，也就是所谓的“机会公平”——承认每个人都有为自己多分的权力，同时又赋予每个人为自己多分的机会。这方法貌似很公平，但第一天就出了漏子，分粥的人将一锅粥全倒进了自己的嘴里，肚皮撑得滚瓜溜圆，其余六人只能眼巴巴地看着流口水。第二天、第三天，轮到机会的人也照此办理。到了第四天就不行了，因为还没有轮到机会的和尚已经躺在地上奄奄一息了，这一制度也行不通。
规则5：学习西方先进的管理经验，譬如联合国安理会五大常任理事国的表决机制，对于分粥，每个人都有一票否决权。这方法看似公平，可最后一施行，大家傻眼了：粥都发霉、发臭了，还是吃不到嘴里。
规则6：参考“二人分饼”的办法，分粥的人最后一个领粥。但由于分粥的人和第一个领粥的人都是固定的，时间一长，两人便私下达成默契：分粥的人先把第一个碗倒得满满的，其余的碗里都只剩下一点点。分完粥后，他私底下去找第一个领粥的人，再去匀回来。
规则7：分粥和领粥都是随机抓阄，且分粥的人最后一个领粥。令人称奇的是，在这一制度下，七只碗里的粥都是一样多，就好像用尺子细细量过的一样。因为每个分粥的人心里都明白，如果碗里的粥有多有少，他确定无疑将享用那份最少的，而且很难找别人匀回来。
以上这七种安排，只有最后一种规则，虽朴实无华却浑然天成，既简洁明了又精巧高效，委实令人惊叹。

案例3：降落伞抽查机制
二战期间，美国统帅巴顿将军在报告中发现，空军使用的降落伞合格率仅为99.9%，这也就意味着，从概率上每1000个跳伞士兵，就会有一个因为降落伞不合格而牺牲。得知这一消息后巴顿将军大火，命人彻查此事。可找了厂家无数次，厂长都说：“已竭尽全力，99.9%是极限，除非能有奇迹的出现。”
后来，巴顿将军改变了检查制度，定期抽查伞包并让厂长亲身试验，自己背着自己厂里制造的降落伞从空中跳下去。从此奇迹便出现了，降落伞的合格率达到了100%。人性亦是如此，厂长自己不用跳，既无生命危险，也不用担责，所以他没必要将落地结果放在心头。可一旦定责到个人，那么降落伞的安全问题，务必能够得到解决。从这个案例中，我们可以看到，很多时候事情发生的背后，往往都是人的问题，而非事的问题。

二、机制设计理论

一般地说，机制设计者有一定的目标，或者有一定的原则觉得应该遵守，他要回答根据这些目标或者原则，这个问题的最优安排是否存在，具体内容为何。这类问题多不胜数，企业家怎样为其员工，特别是其CEO，设计合适的雇佣合约；政府打算把国有资产卖掉，如何进行才能获得最大的收入；国际社会想限制各国温室气体的排放，怎样进行才能把经济活动受到的负面影响降到最低，等等。传统的价格理论和市场供求理论对于解决这些问题的帮助不大，只有到了博弈论出现之后，这些问题才得到有系统的处理。机制设计就是博弈论在处理这些问题的分支理论，而早期发展机制设计的大师，同时是对发展博弈论有重大贡献的大师。
在机制设计中，最常用的方法是拍卖（Auction）机制。拍卖机制是指一种将商品出售给最高出价者的市场机制。通过该机制，卖方可以获得最高的价格，买方可以获得他们确信的产品。而市场竞争则可以保证拍卖过程公正及合理。拍卖是机制设计的早期重点研究课题，考虑下面一个最简单的问题。假定你手上有一件物品打算待价而沽，你知道有N个人对它有兴趣(N为已知数)，每人心中都有一个最高愿意支付的价钱。你不知道每人的心底价为何，但知道它是在0到1000元之间 (且假设它是在此区间内独立地、均匀地分布的) ，又知道这些人一旦得到这件宝物之后不会变卖。此时，你该通过怎样的销售方式，才能带来最大的预期收入呢？即甚么是最优的售卖机制？可供选择的机制很多，比较流行的方式就有公开叫价拍卖和暗标两大类。而每类又有许多不同的变种，举例说，买主可以定立一个最低的卖价(称之为保留价)---若拍卖的结果低于保留价，则拒绝把物品出售---此时首先有如何订定保留价的问题，接着有是否把保留价事先公开为买方所知的问题。我们还能设计出一些现实上不存在的售卖机制。举例说，可以先要求买方每人提出一个六百字的意见书，介绍他们得到该宝物之后的保存方法，然后再根据这些意见书在他们中挑选某几个参加正式的拍卖。这种较复杂的销售方式是否对买主来说更优呢？由于可供考虑的售卖方法陈出不穷，我们有限的想象力也阻止我们把所有可能性列出，要找到真正最优的销售机制，这好像是不可能的事情。事实并非如此，迈尔森的一个理论贡献，为最终解答这个问题---以至所有的机制设计问题-----提供了最关键的一步。这个称为显示原理(Revelation Principle)的结果，既简单又违反直觉，其精妙之处可与李嘉图的相对优势理论相提并论。

2.1显示原理

显示原理告诉我们，要找出最优的销售机制，我们只需把注意力放在某种相对简单而又是我们的想象力能完全理解的销售机制类型，在这类销售机制中最优的一个，就是所有销售机制中最优的一个。由于这个缘故，我们无须考虑更复杂的销售机制，无须担心我们有限的想象力成为我们推敲问题时的限制。打个比方，假设我们要找一个当世对《盘若波罗密多经》认识最深的人，全世界有几十亿人口，这是个很难办到的事情，但是，如果我们知道这个高人就住在拉萨的布特拉宫，那就容易得多了。显示原理告诉我们，在寻找最优机制时，我们可以放心在“布特拉宫”里去寻找，它也告诉我们“布特拉宫”究竟在甚么地方。
回到原本的销售问题上，根据显示原理，我们只需要研究以下类型的销售机制﹕买方各人同时发出一个信息(如藏在信封里)，告知卖主其心中的最高价，然后买主根据事先规定的﹑并为买方所知的法则，决定每人的付款额和何人得到该物品。由于买方只需告知其直接关于其估价的私人信息，而无须报告告知别的信息（诸如对事后如何保管该物品），我们称这种机制为直接机制。所有直接机制的集合，就是比喻中的那个“布特拉宫” 。接着下来的，便是如何在“布特拉宫” 中找出那个高人，完成这个任务的人也是迈尔森本人。
迈尔森在1981年发表的一篇文章中，证明和使用显示原理，并找到了最优销售机制。对于我们上述的特殊问题，其最优销售机制为以下一个具有保留价格的第二价格密封拍卖：每个买家同时将其心中愿意付出的最高价钱告知卖主(藏在信封里)，出价最高者得到该物品，付出的价钱则为第二高价与500元两者之较高者，如其出价低于500元则无须成交，最后，所有没有得到该物的人都无需付款。

2.2 激励相容

在这个机制中，每个买家都愿意如实地把自己的私人信息告知卖方，这点很容易证明。由于买方各人是同时填报其估价，任何一人在填写时，都只能假设其它人的填报值是固定的，不受他自己填报的数据影响。他如实填报，或者(i)成为最高报价者并成功买到该宝物，或者(ii)买不到该宝物。在前一个情况(i)，倘若他予以低报，他要么仍然得到该物品，此时他的支出跟如实填报一样，要么得不该物品，结果自讨苦吃，因此两者比较，如实填报是上策，低报是下策，显然易见，相对于如实填报来说，多报也是下策。在后一种情况(ii)下，根据类似的分析，我们也能证明，如实填报是上策，虚报是下策。
在机制设计中，有两个约束条件是必须遵守的。第一个叫参与约束条件或理性约束条件(participation constraint， rationality constraint)，由于买卖是双方自愿的行为，任何机制都不能强迫买方参与。第二个叫激励兼容条件(incentive compatibility)，即机制设计者在设计时，必须注意到买方各人有其私人信息，而拥有不同私人信息的买主有不同的最优行为，机制设计者要予以重视，因势利导。上面描述的那个机制显然是符合这两个条件的。激励兼容条件在机制设计问题上的重要性，是由赫维奇首先提出来的。
赫维奇和迈尔森的贡献也远远超过寻找最优的销售机制这个问题，它告诉我们，对于任何涉及多人而各人又拥有私人信息的问题，我们都可以设计出一个即尊重各人意愿和利益的机制，从而使世界更接近我们心中的理想世界，它还告诉我们怎样走向这个现实情况约束下最理想的国度。

2.3实活实说模型

设有两个投标人，他们的估价类型 $V_1 、 V_2$ 都是 $[0,1]$ 上的均匀分布。直接机制是这样设计的:

两投标人同时声明 $V_1^{\prime} 、 V_2^{\prime}$ 。
投标人 $i$ 以概率 $q_i=V_i^{\prime} / 2$ 中标，中标的价格为 $p_i=V_i^{\prime} / \theta$ 。

由于 $V_i \in[0,1]$ ，因此 $V_i^{\prime} \in[0,1] ， q_1+q_2 \leq 1$ ，上述两条规则符合直接机制的定义。其中价格函数中的 $\theta$ 是待定参数，其数值正是决定投标人都说实话是否能成为贝叶斯纳什均衡的关键。那么这种直接机制是否真的能成为说实话的机制，在什么条件下是说实话的机制，即在什么情况下两投标人的声明肯定会是他们的真实估价。
假设他们的声明是线性齐次的，具有 $V_i^{\prime}=a_i V_i$ 的形式，也即两投标人声明的估价是他们真实估价的一定倍数或比例。这样投标人 $i$ 声明 $V_i^{\prime}$ 的期望得益为

E u_{i} = \frac{V_{i}^{'}}{2} \times (V_{i} - \frac{V_{i}^{'}}{θ}) = \frac{a_{i} V_{i}}{2} (V_{i} - \frac{a_{i} V_{i}}{θ})

$E u_i=\frac{V_i^{\prime}}{2} \times\left(V_i-\frac{V_i^{\prime}}{\theta}\right)=\frac{a_i V_i}{2}\left(V_i-\frac{a_iV_i}{\theta}\right)$

其均衡条件是找出 $a_i$ ，使期望得益取得最大值，即

max_{a_{i}} \frac{a_{i} V_{i}}{2} (V_{i} - \frac{a_{i} V_{i}}{θ})

$\max _{a_i} \frac{a_i V_i}{2}\left(V_i-\frac{a_i V_i}{\theta}\right)$

其一阶条件为 $a_i=\theta / 2$ 。所谓投标人 $i$ 说实话，即 $a_i=1 ， V_i^{\prime}=V_i$ 。因此，当 $\theta=2$ 时，也就是中标价格为中标人声明估价的一半时，上述直接机制使得两投标人都讲真话是贝叶斯纳什均衡，此时的声明估价也是其真实的估价，因此，是说实话的直接机制。说实话的机制又叫做激励相容的直接机制。在二级密封价格拍卖机制中，每个竞拍者会由于这种机制报出他愿意支付的真实价格。因为，如果某个竞买者（假设为 $A$ )的竞价高于他自己真正愿意支付的价格，而其他竞拍者（假设为 $B$ )也依此原则行事，那么自己( $A$ )就极有可能不得不以某种损失（高于该标的物的实际价值的价格)为代价买下标的物；相反，如果他( $A$ )的出价低于自己愿意支付的价格，那么其他竞拍者( $B$ )就有可能以低于自己( $A$ )原本愿意支付的价格竞得该标的物。因此，在二级密封价格拍卖机制中，真实地出价是一种“占优策略”，即不管竞争对手如何出价，每个竞买人的占优策略都是按其真实支付意愿出价，即“说真话”，这种拍卖机制显然是激励相容的。由于拍卖品最终为支付意愿最高价的竞买人所得，因此这也是一种具有帕累托效率的资源配置机制。在此之前，经济学理论认为，在一场商品交易中，如果交易双方所掌握的信息不对称，市场所产生的均衡结果将是缺乏效率的。但是二级密封价格拍卖机制证明这种观点有失偏颇。市场是否有效率，取决于拍卖机制能否有效地诱导竞拍者“说实话”，报出他们真正愿意支付的最高价格。

2.4拍卖美元

耶鲁大学经济学家马丁·舒比克创造了一个叫拍卖美元的对抗游戏，旨在找出理性决定行为的悖论，即人们看似是在做最理性的选择，但往往最后结果是做出最不理性的决定。游戏如下：拍卖行要拍卖10000美元，100美元起拍且每次加价至少为100美元，最后出价最高的成功拍下这一万美元，但出价第二的也需要同样支付最后一次叫价的金额。
第一个问题，假设被告知者都是理性且聪明的，那么有人会来参加拍卖吗？当然，因为有人如果觉得大家都不来，他一定会来，因为这样基本上就能白白拿走一万元，而且大家都是理性且聪明的，所以一定会来看看。那么假设拍卖开始，如果第一个人出价100，那么其余人会跟吗，答案当然是，因为每个理性人都不能接受别人白白赚走9900美元，理性人会想，我肯定加钱，我出200也还是能赚9800的。假设此时，拍卖最高价出到了5000，第二高的出到4900，那么这时候拍卖会结束吗，当然是不会，因为这时双方坚持下去觉得还有的赚，但是放弃了，那就亏了几千。那么此时一方出到9900，另一方出到10000，那么此时拍卖会结束吗，当然也是不会，因为再加到11000不过是亏损100，但是就此放弃亏的是9900。所以这次拍卖的结果一定是一方的财力不够，宣告破产，另一方以高于10000的价格买走这10000美元。此时，便产生了万元陷阱，我们开头的那个看似傻瓜的问题，却真真实实地发生了。
造成这个结果的关键一点便是这个游戏规则，如果叫价第二高的人放弃，那么他不仅一无所有还会损失一大笔钱，而损失的这笔钱，在经济学中便叫做沉没成本（沉没成本(英文: Sunk Cost)，指由于过去的决策已经产生且不可再收回的成本）。举个例子来说，比如你谈了一个女朋友（或男朋友），在你们恋爱期间已经付出了很多的时间、精力甚至金钱。但有一天你发现你们在一起经常吵架而且感觉到被消耗，你们会选择继续还是分手呢？显然这些年恋爱花费的时间和金钱已经是沉没成本，这时候你可能觉得这么些年下来不容易，就这么分手对不起两个人耗费的时间和精力。但是如果在开始的时候就知道不合适，那么当初你还会开始吗？显然是不会的，可见考虑这些只能让你越陷越深。还有一个典型的例子就是价格战。假设A公司投入了5000万的成本研发出了一款手机，年产5万台，售价5000千元。这时B公司发现手机市场很赚钱，那么同样也研发一款，定价4000元去抢占A的市场。这时A要是没反应，则市场被强占，不仅不赚钱还亏了研发成本，如果反击降价，那么双方则又陷入了美元拍卖陷阱。

三、拍卖Auction

拍卖是一个过程，即：潜在的竞价者对某一商品提交自己的出价，然后由拍卖方从所有出价中选出最高价，该出价者将成为获得商品的中标者。广告交易平台和供应方平台（SSP）与多个需求方平台（DSP）对接，利用拍卖，尤其是次高价投标拍卖（Second-price auction）机制，实时抛售广告展示机会，实现市场的供需平衡。对于网络发布商来说，不了解第一和第二价格拍卖的工作原理意味着无法控制自己的广告库存的销售。如果您不了解拍卖如何运作以及出价如何最终确定，则无法优化广告收入。

3.1 拍卖类型

在我们详细比较第一价格和第二价格拍卖及其利弊之前，让我们来了解几种简单的拍卖：

单项拍卖（Single-Item Auctions）：一个卖方，一个物品， $n$ 个买方（bidder，也可以叫投标人），针对第 $i$ 个买方，下面是几个参数。估价（valuation） $v_i$ ：对于卖品的最大支付意愿（maximum willingness-to-pay），其实也就是对真实价值的计算。效用（utility） $u_i$ ：这里效用模型被叫拟线性效用模型（quasilinear utility model），是买方的实际效用。如果买方在拍卖中输了，什么也没得到，效用显然是 0 ；如果他赢了，支付了 p ，那么 $u_i=v_i-p$ 。
密封拍卖（Sealed-Bid Auctions）:每个买方私密地向卖方提供报价 $b_i$ ，然后卖方选择谁获得该物品（可以是某个人，也可以谁也不给），最后决定支付价格 p pp 。一般都是出价最高的那个人获得商品，实际上一般也没其他选择，这个叫配置策略，而决定价格可以叫定价策略。
第一价格拍卖（First-Price Auctions）：在这个模型中，买方根据他们的中标支付确切的金额。正因为如此，买家试图以接近印象对他们实际价值的价格出价。总的来说，这次拍卖使卖家的收入最大化。
第二价格拍卖（Second-Price Auctions）：第二价格拍卖也叫维克瑞拍卖（Vickery Auctions），由维克瑞发明。在这个模型中，买家支付的价格比拍卖中第二高的出价多0.01美元。尽可能出价最高，以最大限度地提高中标机会，符合买方的利益。
头部竞价（Header bidding）：一种特殊的一级拍卖，买家可以实时对预留库存进行竞价。这使得买家能够争夺优质库存，并帮助出版商最大限度地提高广告收入。Header Bidding的引进完全颠覆了次高价投标拍卖的运行模式。Header Bidding通常都会采用次高价投标拍卖模式
价格下限（Price floor）：这是出版商愿意接受的最低价格。设定合适的价格下限可以帮助发布商保护其广告库存免于被低估。价格地板可以根据配置方式进行固定或适应性。
荷兰式拍卖( Dutch Auction ) 是一种特殊的拍卖形式。亦称“减价拍卖”，它是指拍卖标的的竞价由高到低依次递减直到第一个竞买人应价（达到或超过底价）时击槌成交的一种拍卖。减价式拍卖通常从非常高的价格开始，高的程度有时没有人竞价，这时，价格就以事先确走的数量下降，直到有竞买人愿意接受为止。荷兰式拍卖在减价式拍卖中，第一个实际的竞价常常是最后的竞价。那么，从何谈起这里有竞买人之间激烈的竞争呢？这里确实有竞争是勿庸质疑的，虽然仅仅只有一个竞价，但是这个仅有的竞价是对预期的一种直接反应，如果自己不出价，那么别人就会出价从而失去物品。

3.2示例

现在大致了解了第一价格和第二价格拍卖的工作原理，让我们以一个例子来考虑它们如何影响结算价格。假设三个竞拍者（A、B和C）参加了拍卖，并出价2.4美元、3.1美元和3.4美元来获得印象。在第一价格拍卖的情况下，中标的出价将归于买方C，清算价格将与出价相同，即3.4美元。虽然第一价格拍卖理论上可以使出版商的收入最大化，但它会在试图猜测库存正确价值并超越对方的买家之间引发价格战。从长远来看，这实际上可能会导致对出版商库存的需求下降，因为越来越多的买家无法从他们的广告支出中获得可行的回报，并退出拍卖。(既买家出价过高，导致自己的利益受到损失，慢慢的退出拍卖)
在第二价格拍卖中，尽管中标仍属于买方C，但他们的清算价格将为0.01美元+第二高出价(3.1美元)= 3.11美元。买方在这个印象中节省的金额，0.29美元，被称为折扣。降价是买家避免高估印象价值的机会。然而，由于价格地板设置和其他各种收益优化技术，干净的二价拍卖在程序化媒体购买领域是罕见的。
使事情更加复杂的是，价格下限可以根据出版商使用供应方平台（SSP）配置的方式而有所不同。在硬价格下限的情况下，所有低于阈值的投标将自动丢弃，无需进一步考虑。相比之下，软价格下限可能会考虑并接受在试图"捕获"更多投标总数时仅略低于阈值的投标。

3.3 第一价格密封拍卖

假设有两个个体竞拍一个商品, 个体 1 和 2 对物品的估值服从 $[0,1]$ 之间的独立的均匀分布, 个体的策略是进行报价 $b_i\left(\theta_i\right)=\alpha_i \theta_i$ (简化问题, 假设个体均采用线性出价方式)。如果两个个体出价相同, 则均有 0.5 概率获得该商品。如果个体 $i$ 获得了该商品, 那么支付的价格是其报价。请把这个问题写为一个标准的贝叶斯博弈, 并求解该贝叶斯博峦的均衡。如果是 3 个人或者 $n$ 个人呢? 你得到了什么启发?

参与者： $A, B$
类型: $\theta_A \sim U[0,1], \theta_B \sim U[0,1]$
信念函数: $p\left(\theta_B \mid \theta_A\right)=1$ where $\theta_B \in[0,1]$
策略： $b_i: \Theta_i \rightarrow \alpha_i \Theta_i$ ，即针对每一个自身类型 $\theta_i$ ，进行一个线性报价。这里其实本质上是确定 $\alpha_i$ 。
当个体 $A$ 的报价为 $\alpha_A \theta_A$ 时，它单独获得该商品的概率为 $P\left(\alpha_A \theta_A>\alpha_B \theta_B\right)=P\left(\theta_B<\frac{\alpha_A \theta_A}{\alpha_B}\right)$ ，如果 $\frac{\alpha_B \theta_A}{\alpha_A}=0$ ，那么个体 $A$ 单独获得该商品的概率为 0 ；如果 $\frac{\alpha_A \theta_A}{\alpha_B} \geq 0$ ，那么个体获得该商品的概率为 $P\left(\theta_B<\frac{\alpha_A \theta_A}{\alpha_B}\right)=\frac{\alpha_A \theta_A}{\alpha_B}$ ，。当个体 $A$ 的报价为 $\alpha_A \theta_A$ 时，它和 $B$ 同时获得该商品的概率为
$P\left(\alpha_A \theta_A=\alpha_B \theta_B\right)=P\left(\theta_B=\frac{\alpha_A \theta_A}{\alpha_B}\right)=0$ ，因此无需考虑。当个体 $A$ 的报价为 $\alpha_A \theta_A$ 时且它没有获得该商品时，其收益为 0 。个体 $A$ 采用 $\alpha_A \theta_A$ 的报价方案时，其期望收益为 $\left(\theta_A-\alpha_A \theta_A\right) \frac{\alpha_A \theta_A}{\alpha_B}$ ，最优时 $\alpha_A^*=1 / 2$ ，因此，个体 $A$ 的最优线性报价策略为 $\alpha_A^*=1 / 2$ 。同理可求解个体 $B$ 的最优报价策略也是 $\alpha_B^*=1/2$ 。

3.4第二价格密封拍卖

假设有两个个体竞拍一个商品, 个体 1 和 2 对物品的估值服从 $[0,1]$ 之间的独立的均匀分布, 个体的策略是进行报价 $b_i\left(\theta_i\right)=\alpha_i \theta_i$ (简化问题, 假设个体均采用线性出价方式)。如果两个个体出价相同, 则均有 0.5 概率获得该商品。如果个体 $i$ 获得了该商品, 那么支付的价格是比它低但最接近它的人的报价, 如果他们两个出价相同, 自然支付的价格也是一样的。请把这个问题写为一个标准的贝叶斯博弈, 并求解该贝叶斯博弈的均衡。如果是 3 个人或者 $n$ 个人呢? 如果不是线性报价呢? 如果分布不是均匀分布呢? 你得到了什么启发?

参与者: $A, B$
类型: $\theta_A \sim U[0,1], \theta_B \sim U[0,1]$
信念函数: $p\left(\theta_B \mid \theta_A\right)=1$ where $\theta_B \in[0,1]$
策略： $b_i: \Theta_i \rightarrow \alpha_i \Theta_i$ ，即针对每一个自身类型 $\theta_i$ ，进行一个线性报价。这里其实本质上是确定 $\alpha_i$ 。
当个体 $A$ 的报价为 $\alpha_A \theta_A$ 时，它单独获得该商品的概率为 $P\left(\alpha_A \theta_A>\alpha_B \theta_B\right)=P\left(\theta_B<\frac{\alpha_A \theta_A}{\alpha_B}\right)$ ，如果 $\frac{\alpha_B \theta_A}{\alpha_A}=0$ ，那么个体 $A$ 单独获得该商品的概率为 0 ；如果 $\frac{\alpha_A \theta_A}{\alpha_B} \geq 0$ ，那么个体获得该商品的概率为 $P\left(\theta_B<\frac{\alpha_A \theta_A}{\alpha_B}\right)=\frac{\alpha_A \theta_A}{\alpha_B}$ ，。当个体 $A$ 的报价为 $\alpha_A \theta_A$ 时，它和 $B$ 同时获得该商品的概率为
$P\left(\alpha_A \theta_A=\alpha_B \theta_B\right)=P\left(\theta_B=\frac{\alpha_A \theta_A}{\alpha_B}\right)=0$ ，因此无需考虑。当个体 $A$ 的报价为 $\alpha_A \theta_A$ 时且它没有获得该商品时, 其收益为 0 。
个体 $A$ 采用 $\alpha_A \theta_A$ 的报价方案时，其期望收益为 $\left(\theta_A-\alpha_B \theta_B\right) \frac{\alpha_A \theta_A}{\alpha_B}$ ，最优时 $\alpha_A^*=1$ 。
当然，二价拍卖的好处在于诚实报价是一个弱占优策略，这可以直接进行证明，不依赖于线性策略的假定。

四、双向报价拍卖

考虑一个在拍卖中，买主和卖方对自己的估价都存在私人信息的“双向报价拍卖”问题。

4.1理论博弈模型

双向报价拍卖是这样一种市场交易模式：买方和卖方就某货物进行交易，交易的规则为：买方和卖方同时各报一个价格，拍卖商然后选择成交价格 $P$ 出清市场：设买方的报价为 $P_{b}$ ，卖方的报价为 $P_{s}$ ，如果 $P_{b}\geq P_{s}$ ，则以价格 $P=(P_{b}+ P_{s})/2$ 成交，否则不成交。
在双向报价拍卖中，由于买卖双方对货物的估价都是他们各自的私人信息，相互对对方的估价都不能完全清楚。因此，它是一个静态贝叶斯博弈问题，我们假设买方对货物的估价为 $v_{b}$ ，卖方的估价为 $v_{s}$ ，并设买卖双方相互间都知道对方的估价均匀分布于 $[0,1]$ 区间上。如果买卖双方以价格 $P$ 成交，那么买方的得益为 $v_{b}-P$ ，卖方的得益为 $P-v_{s}$ 。如果没有成交，则双方得益为0。
在这个静态贝叶斯博弈中，买方的策略其实是关于自己估价 $v_{b}$ 的一个价格函数，即 $P_{b}(v_{b})$ ，它确定了买方对自己每一种可能估价 $v_{b}$ 的出价。卖方的策略是设定他自己每种估价 $v_{s}$ 下其要价的一个函数，即 $P_{s}(v_{s})$ 。如果 $[P_{b}(v_{b}),P_{s}(v_{s})]$ 是贝叶斯纳什均衡，则对任意的 $v_{b} \in [0,1]$ ， $P_{b}(v_{b})$ 必须满足

max_{P_{b}} [v_{b} - \frac{P_{b} + E [P_{s} (v_{s}) ∣ P_{b} \geq P_{s} (v_{s})]}{2}] P {P_{b} \geq P_{s} (v_{s})}

$\max \limits_{P_{b}}[v_{b}-\frac{P_{b}+E[P_{s}( v_{s}) \mid P_{b} \geq P_{s} ( v_{s}) ]}{2}] P\{P_{b} \geq P_{s}(v_{s}) \}$

其中 $E[ P_{s}( v_{s}) \mid P_{b}\geqslant P_{s}(v_{s})]$ 是在符合买方的出价大于卖方要价的前提下，买方期望卖方的要价。对任意的 $v_{s} \in [0,1]，P_{s}(v_{s})$ 必须满足

max_{P_{b}} [\frac{P_{s} + E [P_{b} (v_{b}) ∣ P_{b} (v_{b}) \geq P_{s}]}{2} - v_{s}] P {P_{b} (v_{b}) \geq P_{s}}

$\max\limits_{P_{b}}[\frac{P_{s}+E[P_{b}(v_{b}) \mid P_{b}( v_{b}) \geq P_{s}]}{2}-v_{s}]P\{ P_{b}(v_{b}) \geq P_{s} \}$

其中 $E[ P_{b}( v_{b}) \mid P_{b}( v_{b}) \geqslant P_{s}]$ 是在买方出价高于卖方的前提下，卖方期望买方的出价。
此静态贝叶斯也有许多贝叶斯纳什均衡，只要 $P_{b}、P_{s}$ 的函数关系， $v_{b}、v_{s}$ 的值及它们的概率分布同时满足上述两个最大化问题，就构成一个贝叶斯纳什均衡。
为此，我们考虑下面一种比较特殊的交易价格情况，如果最后交易达成，交易价格就只是单一的价格，即在给定价格水平上的均衡。该均衡的特征是：给定 $[0,1]$ 中的任意一个值 $x$ ，买方的策略为，当 $v_{b}\geq x$ 时，则出买价即报价 $P_{b}=x$ ，否则 $P_{b}=0$ ，即不买；同时卖方的策略为 $v_{s}\leq x$ ，则出卖价，即卖方报价 $P_{s}=x$ ，否则 $P_{s}=1$ ，即卖者不卖。
设买方的策略已设定，则卖方只能在以价格 $x$ 成交或不能成交之间进行选择，此时卖方的策略就是卖方对买方策略的最优反应。如在交易有可能成交，即 $v_{s} \leq x \leq v_{b}$ 时， $P_{s}=x$ 是卖方能实现的最高要价，也是对买方策略的最优反应，任何 $P_{s}>x$ 都不可能成交，因为此时成交的得益 $P-v_{s}=x-v_{s}\geq 0$ 。在 $v_{s}>x$ 的情况下，以价格 $P=x$ 成交的得益 $P-v_{s}=x-v_{s}<0$ ，此时不妨要价 $P_{s}=1$ ，此为该种情况下，卖方可能得到的最高卖价，在此价格下，不成交至少能避免损失。因此，卖方的上述策略确实是对买方策略的最佳反应策略。
同样，我们也可以证明，在给定卖方的策略时，买方的上述策略也是对卖方策略的最优反应。由于在这个均衡中可行的成交价格只有 $x$ 一种，因此这个均衡也被称为“单一价格均衡”。在该均衡策略下，我们可以用图1来说明该博弈均衡策略下的效率情况。

图1	图2

在上述均衡策略中，由于只有当 $v_{s} \leq x \leq v_{b}$ 时，交易才会发生，因此只有在图中注明“交易”的长方形区域中的点 $(v_{b},v_{s})$ 代表的双方类型下，才可能发生交易。其实对所有满足 $v_{b}\geq v_{s}$ 的 $(v_{b},v_{s})$ 的组合来说，交易都是有效的，因为如果价格可变，那么理论上总是可以找到满足 $v_{s}\leq p \leq v_{b}$ 的价格 $p$ 使双方以此价格成交都能获得一定的利益。然而，由于单一价格策略均衡中双方的策略都是“要么在 $x$ 这个价格下成交，否则宁愿不成交”，因此当 $(v_{b},v_{s})$ 落在图中两块阴影部分中时就无法成交，虽然阴影部分满足效率条件，但最终无法成交，这意味着双方失去了许多获益的机会，这说明了单一价格均衡未必是双方报价拍卖效率较高的贝叶斯纳什均衡。

4.2数值分析

现在我们也把二价拍卖中博弈方的策略设定为线性函数策略，分析其线性的贝叶斯纳什均衡。假设买方的策略为

P_{b} (v_{b}) = a_{b} + c_{b} v_{b}

$P_{b}(v_{b})=a_{b}+c_{b}v_{b}$

卖方的策略为

P_{s} (v_{s}) = a_{s} + c_{s} v_{s}

$P_{s}(v_{s})=a_{s}+c_{s}v_{s}$

且 $v_{b}$ 和 $v_{s}$ 服从 $[0,1]$ 上的均匀分布，因此 $P_{b}(v_{b})$ 和 $P_{s}(v_{s})$ 也分别服从于 $[a_{b},a_{b}+c_{b}v_{b}]$ 和 $[a_{s},a_{s}+c_{s}v_{s}]$ 的均匀分布。如果 $(P_{b}(v_{b}),P_{s}(v_{s}))$ 是贝叶斯纳什均衡，由

max_{P_{b}} [v_{b} - \frac{P_{b} + E [P_{s} (v_{s}) ∣ P_{b} \geq P_{s} (v_{s})]}{2}] P {P_{b} \geq P_{s} (v_{s})}

$\max\limits_{P_{b}}\left[ v_{b}-\frac{P_{b}+E\left[ P_{s}\left( v_{s}\right) \mid P_{b}\geq P_{s}\left( v_{s}\right) \right] }{2}\right] P\left\{ P_{b}\geq P_{s}\left( v_{s}\right) \right\}$

式得， $P_{b}$ 必须满足

max_{P_{b}} [v_{b} - \frac{1}{2} (P_{b} + \frac{a_{s} + P_{b}}{2})] \frac{P_{b} - a_{s}}{c_{s}}

$\max\limits_{P_{b}}\left[ v_{b}-\frac{1}{2}\left( P_{b}+\frac{a_{s}+P_{b}}{2}\right) \right] \frac{P_{b}-a_{s}}{c_{s}}$

其一阶条件为

P_{b} = \frac{2}{3} v_{b} + \frac{1}{3} a_{s}

$P_{b}=\frac{2}{3}v_{b}+\frac{1}{3}a_{s}$

即如果卖方的策略是线性的，那么买方的最优反应策略也是线性的。同样，由

max_{P_{b}} [\frac{P_{s} + E [P_{b} (v_{b}) ∣ P_{b} (v_{b}) \geq P_{s}]}{2} - v_{s}] P {P_{b} (v_{b}) \geq P_{s}}

$\max \limits_{P_{b}}[\frac{P_{s}+E[P_{b}( v_{b}) \mid P_{b} (v_{b})\geq P_{s}]}{2}-v_{s}]P\left\{P_{b}\left( v_{b}\right) \geq P_{s} \right\}$

得， $P_{s}(v_{s})$
必须满足

max_{P_{s}} [\frac{1}{2} (P_{s} + \frac{P_{s} + a_{b} + c_{b}}{2})] \frac{a_{b} + c_{b} - P_{s}}{c_{b}}

$\max\limits_{P_{s}}\left[ \frac{1}{2}\left( P_{s}+\frac{P_{s}+a_{b}+c_{b}}{2 }\right) \right] \frac{a_{b}+c_{b}-P_{s}}{c_{b}}$

其一阶条件为

P_{s} = \frac{2}{3} v_{s} + \frac{1}{3} (a_{b} + c_{b})

$P_{s}=\frac{2}{3}v_{s}+\frac{1}{3}\left( a_{b}+c_{b}\right)$

亦即，如果买方的策略是线性的，那么卖方的最优反应策略也是线性的。将这两个一阶条件与假设的双方线性策略函数相对照，可得

a_{b} = a_{s} / 3 a_{b} = a_{s} / 3 ， c_{b} = 2 / 3 ， a_{s} = (a_{b} + c_{b}) / 3 ， c_{s} = 2 / 3 c

$a_{b}=a_{s}/3a_{b}=a_{s}/3， \quad c_{b}=2/3，\\\quad a_{s}=(a_{b}+c_{b})/3，\quad c_{s}=2/3c$

于是可得“线性策略均衡”如下：

{\begin{matrix} P_{b} = \frac{2}{3} v_{b} + \frac{1}{12} \\ P_{s} = \frac{2}{3} v_{s} + \frac{1}{4} \end{matrix}

$\{\begin{array}{c} P_{b}=\frac{2}{3}v_{b}+\frac{1}{12} \\ P_{s}=\frac{2}{3}v_{s}+\frac{1}{4} \end{array}$

这就是本博弈的线性策略贝叶斯纳什均衡。
由于二价拍卖中只有当 $P_{b} \geq P_{s}$ 时交易才会成交，因此成交必须满足

\frac{2}{3} v_{b} + \frac{1}{12} \geq \frac{2}{3} v_{s} + \frac{1}{4}

$\frac{2}{3}v_{b}+\frac{1}{12}\geq \frac{2}{3}v_{s}+\frac{1}{4}$

即 $v_{b} \geq v_{s}+1/4$ 时交易才会发生。用图2来表示在上述线性策略均衡下会发生交易的情况。

从图2中可以看出，在该博弈的线性策略均衡中，只有直线 $v_{b}= v_{s}+1/4$ 上方的点 $(v_{b},v_{s})$ 所对应的双方类型下交易才会发生。图中阴影部分的点所代表的双方类型，满足 $v_{b} \geq v_{s}$ ，即买方的估价 $v_{b}$ 高于卖方的估价 $v_{s}$ ，此时交易不会发生。这意味着线性策略的均衡也不能达到最高的效率状态。
比较上述两个图我们可以发现，线性策略贝叶斯纳什均衡中双方进行交易的机会，大于单一价格策略贝叶斯纳什均衡的交易机会。两者都包含了最有效的交易，即当 $v_{s}=0$ ， $v_{b}=1$ ，卖方认为毫无价值的东西，买方却愿意以最大价值来交易，而单一价格均衡则排除了很多有价值的交易。例如当 $v_{s}=0$ 且 $v_{b}$ 小于但接近于 $x$ 时 $(v_{b}=x-\varepsilon， \varepsilon$ 为一足够小的正数)，在单一价格均衡中无法成交，而在线性策略均衡中这种情况是能够成交的，并且双方能够获得相当可观的利益（都接近 $x/2$ )。另一方面，一些无多大价值的交易却能够在单一价格策略下成交，如 $v_{b}$ 略大于 $x$ ( $v_{b}=x+\varepsilon$ )， $v_{s}$ 略小于 $x$ （ $v_{s}=x-\varepsilon$ ），即在图1的交易区域中接近 $(x,x)$ 的点所对应的双方类型组合，在线性策略均衡中是不包括无多大价值的交易的。只包含了价值至少在 $1/4$ 以上的交易。因此，总体上线性策略均衡的效率要比单一价格均衡更高一些。

五、总结

机制设计是博弈论的应用，旨在解决实际问题，构建有效的市场机制或制定合理的决策规则来指导参与者的行为。机制设计的任务是找到一种规则，使得参与者能够在该规则下自由决策，并且遵循规则能够实现某种期望的结果。博弈弈论和机制设计在现实生活中有着广泛的应用。利用这两种方法可以指导市场的运作、决策的制定等方面，对于各种利益冲突的问题都有一定的解决方案。博弈论和机制设计的最终目标，就是为人类提供更加理性、合理的决策方法，以维护社会的公正性和稳定性。