博弈论——完全信息练习题(十六)
1 两名学生报名参加与教授一起准备荣誉论文
两名学生报名参加与教授一起准备荣誉论文。每个人可以决定在自己的项目里投入多少时间:不投入、一周或者两周(仅有这三种选择)。不投入时间的成本为0,每周的成本则为1单位支付。学生投入的时间越多,他的成绩就越明显,所以如果一名学生投入的时间比另一名多,他们之间就会存在一个明显的“领先者”。如果投入的时间相当,那么他们的论文项目就会取得同等的质量。但是,教授只会给出一个A。如果有一个明显的领先者,那么他就会获得A;但是如果两者的论文同样好,教授就要投掷一枚公平的硬币来决定谁会得到这个A。另外一名学生只能得到B。既然双方都希望继续就读研究生,那么得分A的价值为3,而得分B的价值为0。
(a) 写出该博弈的策略式
当两名学生投入相等时,教授会随机选择一名学生得到 ,即
(1)当两名学生均为不投入时,收益为
(2)当两名学生均为投入一周时,收益为
(3)当两名学生均为投入两周时,收益为
学生1/学生2 | 不投入 | 一周 | 两周 |
---|---|---|---|
不投入 | 1.5,1.5 | 0,2 | 0,1 |
一周 | 2,0 | 0.5,0.5 | -1,1 |
两周 | 1,0 | 1,-1 | -0.5,-0.5 |
(b) 存在严格劣策略吗? 存在弱劣势吗?
对于学生 1 而言,不投入策略是学生 2 选择投入两周的最佳策略;投入一周策略是学生 2 选择不投入的最佳策略;投入 2 周策略是学生 2 选择投入一周的最佳策略。类似地,思路可以应用于学生2。综上,不存在严格劣策略,也不存在弱劣势。
(c) 找出唯一的混合策略纳什均衡
假设学生 1 混合策略为 ,学生 2 混合策略为 ,对于学生 1 的期望效用函数为
求微分,则一阶条件为 .
对学生 2 进行类似操作,可得 .
所以,学生 1 混合策略为 ,学生 2 混合策略为 时,是唯一的混合策略纳什均衡。
2 考虑一个工作申请的博弈。两个学生同时向两家企业申请工作,每家企业只有一个工作岗位。工作申请规则如下:每个学生只能向其中一家企业申请工作;如果一家企业只有一个学生申请,该学生获得工作;如果一家企业有两个学生申请,则每个学生获得工作的概率为1/2。现在假定每家企业的工资满足:,则:(a)写出以上博弈的战略式描述;(b)求出以上博弈的所有纳什均衡。
解:(a) 该博弈的战略式描述为:
甲/乙 | 企业1 | 企业2 |
---|---|---|
企业1 | ||
企业2 |
(b) 求出所有纳什均衡
(1) 纯战略纳什均衡
- 若甲选择企业1,乙将选择企业2;若乙选择企业2,甲必然选择企业1,因此,(企业1, 企业2)是一个纯战略纳什均衡。
- 若甲选择企业2,乙将选择企业1;若乙选择企业1,甲必然选择企业2,因此,(企业2, 企业1)也是一个纯战略纳什均衡。
(2) 混合战略纳什均衡
- 假定甲选择企业1的概率为 ,选择企业2的概率为 ;乙选择企业1的概率为 ,选择企业2的概率为 。
- 则甲选择企业1的期望收益为 ,选择企业2的期望收益为 。
- 由二者相等可得乙选择两个企业的概率分别为:
- 同理可得甲选择两家企业的概率:
最后的混合均衡是两学生均以 的概率决定向企业1与企业2提出申请。
3 (分钱)两人之间分美元。使用下述方法:每个人说出一个至多为10的数字(非负整数)。如果两人说出的数字之和不超过10,那么每个人得到她所说出的钱数(多出的钱被销毁),如果两人提出的数字之和超过10并且数目不同,那么说出较小数的人得到自己所说的钱数,而另一个人则得到剩余的钱。如果两数之和超过10并且两数相等,那么每个人各自得到。确定每个局中人关于另一个局中人每个行动的最优反应,从而求得博弈的纳什均衡。
最优反应函数 | 纳什均衡 |
---|---|
![]() |
![]() |
4 伯川德博弈
假定两个寡头企业之间进行价格竞争,两企业生产的产品是完全替代的,并且两家企业的生产成本函数为 。市场逆需求函数是 ,其中 是总供给, 是大于 的常数。求出企业 所面临市场需求以及纳什均衡时的价格。
假定消费者从价格低的厂商购买产品,如果两企业价格相同,就平分市场,如果企业 的价格高于另一企业,则企业 的需求量为 0,反之,其它企业的需求量为 0。因此,企业 的需求函数由下式给出:
从上述需求函数可以看出,企业 绝不会将其价格定得高于其它企业;由于对称性,其它企业也不会将价格定得高于企业 ,因此,博弈的均衡结果只可能是每家企业的价格都相同,即 。若 那么每家企业的利润
因此,企业 只要将其价格略微低于其它企业就将获得整个市场的需求,而且利润也会上升至
其中。同样,其它企业也会采取相同的策略,如果此下去,直到每家厂商都不会选择降价策略,此时的均衡结果只可能是 。此时,企业 的需求函数为 。
5 离散的古诺博弈
假设有三个工厂在生产销售同样的商品,它们的产量分别用 和 表示,且 ,即产量只能取正整数(离散)。市场的总产量为 ,而市场 价格是总产量 的函数,表示为
假设各个工厂都没有生产成本,并假设三个工厂的总产量不超过20(超过20时总产量会变为0), 我们定义工厂 的利润函数为
从利润函数中可以看出三个工厂的产量(策略)和利润是相互依赖的,也就是说每个工厂的利润除 了与自己的产量有关外,还受到其他工厂的产量影响。我们将几种可能的产量组合用表格展示如下
4 | 8 | 6 | 2 | 8 | 16 | 12 |
4 | 5 | 6 | 5 | 20 | 25 | 30 |
5 | 5 | 6 | 4 | 20 | 20 | 24 |
5 | 5 | 5 | 4 | 25 | 25 | 25 |
3 | 3 | 3 | 11 | 33 | 33 | 33 |
7 | 3 | 3 | 7 | 49 | 21 | 21 |
我们以第一行为例,三个工厂的产量分别为4,8和6,我们记这个产量组合(策略组合)为(4,8,6),此时市场价格为20-(4+8+6)=2,三个工厂的利润分别为8,6,和12。这个策略组合显然不是最优的,因为任何一个工厂降低自己的产量都会导致所有工厂的利润增加,比如第二行中,工厂2将自己的产量由8降到5,此时的策略(产量)组合为(4,5,6),产品价格由2上升到5,三个工厂的利润为(20,25,30),比之前的利润(8,6,12)要好。
继续分析来看,当前策略(4,5,6),也不是最好的策略并且有不稳定性。对于工厂2和工厂3来说,他们是满意于当前的策略的,因为它们提高或者降低产量都会让自己的利润下降,即它们不愿意改变自己的策略。然而,工厂1并不满意于当前的策略,如果它提高1个单位的产量,并不会影响自己的利润,并且能提高它在市场中的地位。比如表格第三行,工厂1提高1个单位产量,此时策略组合为(5,5,6),市场价格为4,三个工厂的利润为(20,20,24)。
然而,策略组合(5,5,6)也不是一个稳定的策略。我们可以发现策略(产量)组合(5,5,5)是一个稳定策略,因为任何一个工厂单方面提高或者降低产量都会减少利润。也就是说,每个工厂没有理由单方面做出改变,因为做出改变后会降低利润,因此这个策略组合是一个均衡策略。
一般来说,均衡策略是稳定的但不一定是最优的,比如(5,5,5)这个策略是稳定的但不是最优的。我们假设有一个策略(3,3,3),在该策略下市场价格为11,三个工厂的利润为(33,33,33),这个策略的利润(收益)会比(5,5,5)这个策略的利润高,如表格倒数第二行所示。但实际上,三个工厂并不会采取(3,3,3)这个策略,因为在两个工厂的产量都为3时,另一个工厂单方面提高产量会使得自己的利润提高,二另外两个产量为3的工厂的利润会下降。如表格倒数第一行所示,如果工厂2和工厂3的产量都为3,工厂1单方面将自己的产量提高到7,那么三个工厂的利润是(49,21,21),可以看到工厂1的利润大大提高,而工厂2和工厂3的利润会下降。因此(3,3,3)并不是稳定的策略,因为工厂之间不会互相信任,如果某个工厂单方面提高产量会伤害到其他工厂的利益,所以任何工厂都不会去冒这个险,虽然(3,3,3)能比(5,5,5)带来更高的利润。
因此这个博弈的最终(均衡)结果是每个工厂的产量为5,即策略是(5,5,5),市场价是2,各个工厂获得25个单位的利润。
6 下面的收益矩阵表示两人静态博弈。
问当 、 和 之间满足什么条件时,该博弈(1) 用严格下策反复消去法简化或找出博弈的均衡;(2)存在纯策略纳什均衡。
解:(1) 只要出现 且 且 E 或 且 四种情况中的任何一种, 就可以用严格下策反复消去法简化或直接求出博弈的均衡, 因为这时候 D、U、R、L 分别是相应局中人相对于-各自另一策略的严格下策。
(2) 纯策略纳什均衡是各局中人单独改变策略都无利可图的策路组合。在上述博弈中, 只要满足 且 且 且 且 几种情况中的任何一种, 就存在纯策格纳什均衡。
7 两个人一起参加某项工程。
每个人的努力程度 , 成本为 , 该项目的产出为 。个体的努力程度不影响到项目的分配方法, 项目的产出在2个体之间均分。试回答以下问题:
(1)如果 , 试求此博弈的均衡 (即两个个体选择的最优努力程度)。
(2)如果 , 试求此博弈的均衡。
解 (1) 收益为:
得出反应函数为:
纳什均衡 为两条反应函数的交点, 代入得出:,两个人的努力程度为0,两个人都不会努力的。
(2)收益为
分别求偏导:
此时, 两个人的努力程度都与对方的努力程度有关, 时, 博弈一方越努力, 另一方就选择努力程度为0,此时纳什均衡为; 时, 博弈一方越努力, 另一方就选择努力程度为1, 时, 双方收益均达到最大值, 此时纳什均衡为。
8 监管博弈。
在纳税检查的博弈中, 假设 为应纳税款, 为检查成本, 是偷税罚款, 且 为税务机关检查的概率, 为纳税人逃税的概率,不存在纯战略纳什均衡。试(1) 写出支付矩阵;(2) 分析混合策略纳什均衡。
解:(1)该博弈的支付矩阵如下表:
税收机关/纳税人 | 逃税 | 不逃税 |
---|---|---|
检查 | A-C+F, -A-F | A-C, -A |
不检查 | 0, 0 | A, -A |
(2) 先分析税收检查边际: 因为 为税务机关检查的概率, 为纳税人逃税的概率。给定 , 税收机关选择检查与否的期望收益为:
, 得: 。
如果纳税人逃税概率小于 , 税收机关的最优决策是不检查, 否则是检查。
再分析逃税边际: 给定 , 纳税人选择逃税与否的期望收益是:
, 得: 。即如果税收机关检查的概率小于 , 纳税人的最优选择是 逃税, 否则是交税。
因此, 混合纳什均衡是 ( , 即税收机关以 的概率查税, 而纳税人以 的概率逃税。
9 双寡头垄断企业博弈。
假设双头垄断企业的成本函数分别为: , 开场需求曲线为 , 其 中, .
(1) 求出古诺 (Cournot) 均得情况下的产量、价格和利润、求出各自的反应和等利润曲线, 并图示均衡点。
(2)求出斯塔克贝格 (Stackelberg) 均衡情况下的产量、价格和利润, 并以图形表示,
(3) 说明导致上述两种均衡结果差异的原因。
解:(1)对于垄断企业 1 来说:
这是垄断企业 1 的反应函数。
其等利润曲线为:
对垄断企业 2 来说:
这是垄断企业 2 的反应函数。
其等利润曲线为:
在达到均衡时, 有:
均衡时的价格为:
两垄断企业的利润分别为:
均衡点可图示为:
(1)图 | (2) 图 |
---|---|
![]() |
![]() |
(2) 当垄断企业 1 为领导者时, 企业 2 视企业 1 的产量为既定, 其反应函数为:
则企业 1 的问题可简化为:
均衡时价格为:
利润为:
企业2领先时可依此类推。
(3)当企业1为领先者时,其获得的利润要比古诺竞争下多。而企业2获得的利润较少。这是因为,企业1先行动时,其能考虑企业2的反应,并以此来制定自己的生产计划,而企业2只能被动地接受企业1的既定产量,计划自己的产出,这是一种“先动优势”。
10 沙滩卖冰
A、B两智能体(agent)在长度为1的直线区域上销售相同品种、相同价格的冷饮,游客均匀分布在海滩上且就近购买1单位的冷饮。证明:策略组合 是该智能体博弈的唯一纯策略纳什均衡。
解:
两个参与者的策略集就都是在0与1之间:,画在同一个数轴中的关系可见下图:
图1 | 图2 |
---|---|
![]() |
![]() |
那么支付函数怎么写呢?
在图1中,我们知道:在范围内,顾客会买;在 区间内,顾客会买,而在之间的时候,在中点左边顾客会买,中点右边顾客会买。所以可得到如下的支付函数:
下面我们证明的是在,以及但不等于的时候均不是纳什均衡。
(1)证明处不存在纳什均衡:
此处采取反证法,假设在时存在纳什均衡。也就是上面图2中所示的区域。即假设:在中存在纳什均衡,设为,则 ,且。之后我们设存在一个任意小的正整数,使得(见图3),则根据支付函数有:
图3 | 图4 |
---|---|
![]() |
![]() |
所以我们可以明显观察到,,所以有向右移动的趋势,亦即越大,所获得的收益越大,所以一定会向右移。则不满足纳什均衡定义。
纳什均衡定义是:如果和是纳什均衡,那每个参与者对对方都是最优反应,他不愿单独改变战略。
但是在这里, 单独改变战略会对他自己有更有利的影响,所以她当然愿意改变,所以不满足纳什均衡的要求。
(2)证明处不存在纳什均衡:
还是应用反证法,假设在区域中存在纳什均衡,设纳什均衡的状态分别为,则有。同样的,设有一个无穷小的正整数,使得满足,关系图4所示。那么根据支付函数有以下两个式子:
同理可得,对并不是最优反应。
(3)证明但小于 处不存在纳什均衡:
假设这个区域中存在纳什均衡 ,且处于小于 的区域,就有:
假设有一个无穷小的正整数 ,使得式子满足:
则根据支付函数有:
根据上式同理可得,该关系不满足纳什均衡的定义,所以证明该区间不存在纳什均衡。
(4)证明 但大于 处不存在纳什均衡:
选取一个正整数 ,使得其满足: ,使得 , 则有支付函数如下:
再让 , 这时 ,这时发现计算支付函数发现仍然不如 处大:
综上所述,问题得证。
11 试给出下述博弈的纳什均衡
A\B | L | R |
---|---|---|
U | 1,3 | 2,5 |
D | 4,1 | 6,2 |
解:由划线解得知有一个纯纳什均衡(D,R )。再看看它是否有混合纳什均衡,设B的混合策略为,则有均衡条件:
得 , 这是不可能的, 故无混合纳什均衡, 只有这一个纯纳什均衡。
12 修改题1中的收益值使其有混合纳什均衡
解:由奇数定理,若使它先有两个纯纳什均衡,则很可能就有另一个混合纳什均衡。
将博弈改成上述模型, 则
同样, 设 的混合策略为 , 则
于是混合纳什均衡为 。
13 三寡头古诺博弈
(Gibbons, 1992) 考虑一个由三个寡头厂商 占有的市场, 反需求函数为 , 其中 为常数, 表示厂商 生产的产量。假设每个厂商生产的边际成本为 , 且固定成本为 0 , 这三个厂商按照如下顺序作出产出决策: (i) 厂商 1 选择 , (ii) 厂商 2 和 3 在观察到 之后, 同时并且分别选择各自的产量 和 ,求此博弈的子博弈完美纳什均衡。
解:根据逆向归纳法, 我们首先求出在给定厂商 1 的产量 时, 厂商 2 和 3 同时作出决策的子博弈的纳什均衡, 然后回到第一阶段, 给定厂商 2 和 3 的最优反应之后, 求出厂商 1 的最优产量.
给定厂商 1 的产量 , 厂商 2 和 3 的最优化问题分别为:
从一阶条件得到厂商 2 和 3 的最优反应函数为: , , 联立得纳什均衡为: , 给定 厂商 2 和 3 的最优反应, 厂商 1 的最优化问题为: , 由 一阶条件得到厂商 1 的最优产量为: , 且厂商 2 和 3 的最优产量为: 。
14 (FrancescoSquintani,2006)考虑如下的两人T期博弈:有一笔存在银行里数目不断增长的现金,在第t(t=1,2,…,T)期该笔现金的数量为2t。在每一期里面,两个参与人必须同时决定是否将现金从银行取出。如果只有一个人决定将现金取出,那么这个人将得到累积到当期的全部现金,而另一个人的收益为0。如果两个人都决定将现金取出,那么他们各得到累积到当期的现金的一半。如果两个人都决定不将现金取出,那么此博弈进行到下一期。如果博弈进行到最一期(第T期)时两个人都决定不将现金取出,那么他们每人得到T的收益。将这个博弈表示为扩展式博弈并找出子博弈完美纳什均衡。
解:如果直到第T−1期,两个人都没有把现金取出,则在第T期,两个人面对的子博弈为
取 | 不取 | |
---|---|---|
取 | T,T | 2T,0 |
不取 | 0,2T | T,T |
此子博弈的纳什均衡为:(取,取),参与人的收益为(T,T)。
如果T=1
原博弈唯一的子博弈完美纳什均衡为:(取,取)。
如果T=2
我们有2(T-1)=T,此时(取,取)和(不取,不取)均是纳什均衡。故原博弈有两个子博弈完美纳什均衡:
- ((取,取),(取,取))
- ((不取,取),(不取,取))
如果T>2
我们有2(T-1)>T,故在子博弈完美纳什均衡中,两个参与人在T-1期都会选择取钱。
重复上面的讨论,我们得到对于T≥2,原T期博弈有两个子博弈完美纳什均衡:((取,取,…,取),((取,取,…,取)),((不取,取,…,取),((不取,取,…,取))
15 考虑如下市场进入博弈:厂商2(市场进入者)首先选择是否进入市场。如果厂商2选择不进入(O),那么厂商1和2的收益为(4,0)。如果厂商2选择进入(I),并且厂商1选择容纳(A),那么厂商1和2的收益为(2,2),如果厂商1选择竞争(C),那么厂商1和2的收益为(2,2)。(1)将这个博弈表示成策略式博弈和扩展式博弈;(2)找出这个博弈的全部纳什均衡,说明其中哪个均衡有被占优策略;(3)假设厂商1面对的进入厂商有九个,分别为厂商2,3,,10…,这些厂商按数字从小到大顺序依次选择是否进入,假设后进入的厂商可以观察到全面厂商的策略,找到一个纳什均衡使得厂商2,3,,10…的策略均为不进入,在这个均衡下哪个厂商采用了被占优策略;(4)找出这个博弈的子博弈完美纳什均衡,用重复剔除弱被占优策略的方法求出这个博弈的结果。
解:策略式博弈表示
厂商1:A | 厂商1:C | |
---|---|---|
厂商2:I | 2,2 | -2,-2 |
厂商2:O | 4,0 | 4,0 |
扩展式博弈表示:厂商2首先选择是否进入市场
- 如果选择不进入(O),收益为(4,0)。
- 如果选择进入(I):
- 厂商1选择容纳(A),收益为(2,2)。
- 厂商1选择竞争(C),收益为(-2,-2)。
这个博弈的纳什均衡为:(A,I);(C,O)。在(C,O)中,厂商1选择了弱被占优策略C。
假设厂商1面对的进入厂商有九个,分别为厂商2,3,...,10,这些厂商按数字从小到大顺序依次选择是否进入,假设后进入的厂商可以观察到全面厂商的策略。
此博弈的一个纳什均衡为:
- 厂商1在每一期如果有厂商进入均选择竞争。
- 厂商2,3,...,10均选择不进入。
在这个纳什均衡中,厂商1的策略被如下策略占优:
- 在2,3,...,9期如果有厂商进入均选择竞争。
- 在第10期如果有厂商进入则选择容纳。
子博弈完美纳什均衡
- 在每一期如果有厂商进入,厂商1均选择容纳。
- 厂商2,3,...,10均选择进入。
重复剔除弱被占优策略得到的结果与子博弈完美纳什均衡相同。
16 考虑如下的海盗分宝石博弈:10个海盗考虑如何分配100颗宝石,他们经过抽签按照编号由1到10的顺序(记为海盗1到海盗10)依次提出分配方案。博弈的规则如下:宝石只能按整数进行分配。海盗1首先提出分配方案,如果有半数或者半数以上的(包括剔除分配方案的)海盗投票表示通过该方案即实施该方案,博弈结束;否则海盗1将被其他海盗投入海中喂鲨鱼,剩下9个海盗继续该博弈。接下来由海盗2提出分配方案,规则与前面相同,若通过则博弈结束,否则海盗2将被喂鲨鱼。依次类推,并且假设所有的海盗在对接受和拒绝分配方案无差异的时候一定会选择拒绝。求出此博弈的子博弈完美纳什均衡,即每一个海盗i的分配方案。
解:采用逆向归纳法。首先考虑还剩下两个海盗,即海盗9和海盗10的情况,此时海盗9显然会把100颗宝石都分给他自己,而给海盗10零颗宝石,并且该分配方案(0,…,0,100,0)将会通过。接下来考虑还剩下海盗8,9和10的情况,根据前面的讨论,如果海盗8被喂鲨鱼的话,海盗10将会什么都得不到;如果海盗8把100颗宝石都分给自己的话,海盗10将会对接受和拒绝无差异,根据假设海盗10会拒绝;又因为海盗9一定会拒绝海盗8的分配方案,故海盗8的最优分配方案为(0,…,0,99,0,1),且该分配方案会被通过。根据同样的逻辑,我们可以得到海盗7的最优分配方案为(0,…,0,99,0,1,0),海盗6的最优分配方案为(0,…,0,98,0,1,0,1),依次类推,海盗1的最优分配方案为(96,0,1,0,1,0,1,0,1,0),且此方案将被通过。
17 考虑一个承诺博弈,存在两个参与人。参与人 2首先行动,选择行动 的取值范围是 。参与人 1观察到参与人 2的行动,决定向参与人 2转移支付 ,但是参与人 1也可以事先确定支付规则 。现在假定参与人 2的效用函数为 ,参与人 1的效用函数为 ,其中 表示参与人采取行动的成本,且 时为 0, 时为 。
(1) 如果参与人 1没有承诺能力,可以随意修改事先宣布的支付规则,则此时的子博弈精练纳什均衡。
(2) 如果参与人 1有承诺能力,只能按照事先确定的支付规则进行支付,则此时的子博弈精练纳什均衡。
解:(1)若参与人 1没有承诺能力,则该博弈的行动顺序便为参与人2先行动,而后参与人1再行动。在这种情况下, 是可以随便改变的。
对于参与人1而言,其最优化问题为: 最大时,。
对于参与人 2而言,其最优化问题为:,把参与人1的最优条件代入可得:,最优化 得 ,此时 。
所以该博弈的子博弈精练纳什均衡为:。
(2)若参与人1有承诺能力,则它在最优的情况下应该支付 以使得 尽可能偏向 1,由于 ,所以在取 的情况下,。当 时,。所以该博弈的子博弈精练纳什均衡是:参与人 1承诺 ,结果是 。
18 射手博弈
射手A、B、C以抽签的方式决定轮流开枪的顺序并进行决斗,A的命中率为100%,B的命中率为80%,C的命中率为50%。
(1)若按顺序进行且C首先开枪射击,他应该怎样做?
(2)如果按顺序进行射击,证明C存活的可能性最大。
(3)若每一轮开枪的人是任意选择的,证明射手存活的概率与命中率完全相反
【解】射手追求的目标一定是两个:首先是考虑保命,然后再考虑射击谁。
(1)若按顺序进行且C首先开枪射击,他应该怎样做?
设 表示三人都活着,且按ABC顺序射击时A存活的概率,其余表示含义类似。
①如果C射击其他人,一定是射击A。(因为首先要考虑保命,所以一定会优先射击那个命中率高的人)
如果C击中A,那么他的支付为 。
因为在BC这个顺序下C存活的概率取决于B的命中率,如果B把C打中了,那么C存活概率就是0,打所以这种情况下C的存活概率是 ,如果没有打中的话(概率是 ),就该C打B了。
所以有式子:
而
于是可得:
没有击中A的情况如②:
②如果C射向空中。显然A将射向B而不是C,并且B将会射向A而不是C。(因为首先要考虑保命,所以一定会优先射击那个命中率高的人)。因而A和B将会互相射击,直到其中一个人出局,接着该轮到C射击了。
若A是A、B互相射击的幸存者,则此时C幸存的概率为 。
若B是A、B互相射击的幸存者,则此时C幸存的概率是 。
因为 ,均大于 。所以C射向空中是其最优选择。
(2)如果按顺序进行射击,证明C存活的可能性最大。
证明:①假设A在B之前射击,顺序可能为CAB或ACB或ABC三种可能。
因为C射向空中,A一定确保能干掉B,所以
于是可得:
②假设B在A之前射击,顺序为CBA或BCA或BAC三种可能。那么B就会射向A,击中的概率为4/5,因而
此外
(3)若每一轮开枪的人是任意选择的,证明存活率与命中率完全相反。
【证明】设 表示A开第一枪时A幸存概率, 表示A总体幸存概率, 表示AB两人谁开第一枪是任意的。其余类似表示。
如果下一轮进行射击的选手任意选择,结果依然是A和B将会互相射击直到两人中只有一人幸存。无论如何,显然C更愿意与B一对一较量而不是与A,所以C有机会射击的话将会射向A。
现在分析两个人的情形:
,
以此类推:
于是有
进而有:
现在,显然:
同样, 容易得到
和
合并到一起计算,于是得到:
于是有
得证。
19 Mixed strategy equilibrium of Hawk-Dove
Denote by a payoff function whose expected value represents player i's preferences. The conditions in the problem imply that for player 1 we have
and
Given (Aggressive, Aggressive and (Passive, Aggressive , we have
and
so that
Similarly,
Thus the game is given in the left panel of Figure 25.1. The players' best response functions are shown in the right panel. The game has three mixed strategy Nash equilibria: , and .
- 精神病医生 A, B 同时在一条很长的路线边选择各自的诊所位置,这条公路从 0 到 1 的区间表示。公路到 1 这个区间属于铁路公司,而 1/4 到 1 这个区间属于加利福尼亚州。医生 A 同时拥有德克萨斯州和加利福尼亚州的医生执照,而医生 B 只拥有德克萨斯州的执照。假设两人沿这条公路都均匀分布,每个病人就近看病,每位医生的收入就是到达诊所的病人的数量。设医生 A(参见下图)的策略空间为(选择诊所的位置为) = {0,1/8,1/4,3/8,1/2,5/8,3/4,7/8,1}; 医生 B(参见者 2)的策略空间为 = {0,1/8,1/4}。
试求解:(1) 试图画出医生的收益矩阵; (2) 利用划线法找出该博弈的纯策略纳什均衡。
解:(1)如果医生 A 选择在 处设置诊所,医生 B 选择在 处设置诊所,收益矩阵见下表。
医生 A \医生 B | 0 | 1/8 | 1/4 |
---|---|---|---|
0 | 1/2, 1/2 | 1/16, 15/16 | 1/8, 7/8 |
1/8 | 15/16, 1/16 | 1/2, 1/2 | 3/16, 13/16 |
1/4 | 7/8, 1/8 | 13/16, 3/16 | 1/2, 1/2 |
3/8 | 13/16, 3/16 | 3/4, 1/4 | 11/16, 5/16 |
1/2 | 3/4, 1/4 | 11/16, 5/16 | 5/8, 3/8 |
5/8 | 11/16, 5/16 | 5/8, 3/8 | 9/16, 7/16 |
3/4 | 5/8, 3/8 | 9/16, 7/16 | 1/2, 1/2 |
7/8 | 9/16, 7/16 | 1/2, 1/2 | 7/16, 9/16 |
1 | 1/2, 1/2 | 7/16, 9/16 | 3/8, 5/8 |
(2)使用划线法(请阅读自己手在上图划线),可以找到此博弈的纯策略纳什均衡为 s* = (3/8, 1/4)。均衡结果表明,医生 A 的诊所选在 = 3/8 处,医生 B 的诊所选在 = 1/8 处,对应的收益为 = 11/16, = 5/16。在这种均衡状态下推进单方面移动诊所位置,谁的收入绝不会得到改善。
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· 全程不用写代码,我用AI程序员写了一个飞机大战
· DeepSeek 开源周回顾「GitHub 热点速览」
· 记一次.NET内存居高不下排查解决与启示
· 物流快递公司核心技术能力-地址解析分单基础技术分享
· .NET 10首个预览版发布:重大改进与新特性概览!