读书笔记: 博弈论导论 - 11 - 完整信息的动态博弈 战略协议

读书笔记: 博弈论导论 - 11 - 完整信息的动态博弈 战略协议

战略协议(Strategic Bargaining)

本文是Game Theory An Introduction (by Steven Tadelis) 的学习笔记。

协议是多方对一个剩余(surplus),通过提议,尝试达成一致意见。

一个两人协议博弈的过程:

  • 第一回合
    • 玩家1提出分配(x,1x),玩家1得到x,玩家2得到1-x。
    • 如果玩家2表示接受,博弈结束,v1=x,v2=1x。如果玩家2反对,进入下一轮
  • 第二回合
    • 剩余变成了1δ。折扣率0<δ<1
    • 玩家2提出分配(x,1x),玩家1得到x,玩家2得到1-x。
    • 如果玩家1表示接受,博弈结束,v1=δx,v2=δ(1x)。如果玩家1反对,进入下一轮。
  • 第三回合及以后
    • 博弈如上继续,在奇数回合,玩家2的反对则导致其在下一轮变成提议者,反之亦然。
    • 每个回合的继续,到导致剩余的一次折扣,在第t个回合,剩余未δt1

协议博弈和之前博弈的不同之处:

  • 如果提议被接受,博弈会在任何回合结束。
  • 收益只有在整个博弈结束时才产生,而不是每个回合就会产生。

只有一轮的协议:最后的话博弈(The ultimatum game)

take it or leave it.
推论:11.1

在一个T=1的协议博弈中,剩余的任何分配都能被支持为一个纳什博弈:x[0,1],(v1,v2)=(x,1x).
推论:11.2
在一个T=1的协议博弈中,允许一个唯一的子博弈精炼均衡,在这个均衡中,玩家1提供x=1,并且玩家2接受任何x1

有限回合的协议博弈

推论:11.3

任何子博弈精炼均衡必定导致玩家们可以在第一回合达成一致。
两人奇数回合的协议博弈的结果

(1)v1=x1=1+δT1+δ and v2=(1x1)=δδT1+δlimTv1=limT1+δT1+δ=11+δlimTv2=limTδδT1+δ=δ1+δlimδ1limTv1=limδ111+δ=12limδ1limTv2=limδ1δ1+δ=12

说明了

  • 玩家1拥有last-mover take-it-or-leave-it 优势和 first-mover折扣优势,意味着: v1>v2
  • 如果玩家都是有耐性的(也就是说不接受达到自己最低要求的提议),则last-mover take-it-or-leave-it优势消失了。
  • 长期的回合消除了last-mover take-it-or-leave-it优势。
  • δ=1消除了first-mover优势。

无限回合的协议博弈

两人无限回合的协议博弈的结果

(2)v¯1=v¯2=v¯v_1=v_2=v_v_=1δv¯v¯=1δv_v_=v¯=11+δwherev¯ : the best subgame-perfect equilibriumv_ : the worst subgame-perfect equilibrium

协议立法

封闭规则协议(Closed-Rule Bargaining)

博弈规则:

有N奇数个玩家,需要N+12个接受才能是提议通过。
在每个周期里,每个玩家都有相同的可能性称为提议者。
博弈结果:

(3)wherek : the proposer's best responsev : the expected payoff for any player i

提议者的最佳收益:需要得到n-1的人的同意,由于折扣优势,这个n-1个人的收益为δv

(4)k=1N12δv

回应者的收益:有1N可能性成为提议者,拿到k;
N1N的可能性成为回应者,并且只有12的可能性(因为提议者只提供收益给回应者中的一半人)拿到δv

(5)v=kN+N12Nδv

计算结果:

(6)v=1Nk(N)=1δ(N12N)

说明了

  • 当回扣率增加,提议者的收益变少。
  • 玩家越多,提议者收益越大,回应者收益越少。

开放规则协议(Opened-Rule Bargaining)

博弈规则:

有N奇数个玩家。
提议者提出一个协议,
有一个修订者提出一个修改协议。
如果提议者的协议通过了N+12。则被接受。
否则,修改协议变成主协议。
一个新的修订者提出一个修改协议。
再次投票,重复上面的过程。

保证方案(guaranteed success)

无论那个响应者成为修订者,都可通过的方案。
案例:3个玩家。

(7)wherek : the proposer's best responsev(k) : the expected payoff for any player i

回应者的收益:一方面为1k2,一方面为δv(k)

(8)1k2=δv(k)

修订者的收益:由于对称性,修订者的给自己的收益v(k)应该是k。

(9)v(k)=k

计算结果:

(10)k=11+2δ

说明了

  • 玩家越有耐心,提议者的付出越多。
  • 封闭规则对提议者有利。

冒险方案(risky success)

冒一个部分响应者不会成为修订者的风险。

(11)wherek : the proposer's value to himselfv(k) : the expected payoff for proposerv(0) : the expected payoff for the player who will be offered 0

回应者的收益:一方面为1k,一方面为δv(k)

(12)1k=δv(k)

提议者的期望收益:有12可能性拿到k;如果冒险失败,有12可能性拿到v(0)。

(13)v(k)=12k+12δv(0)

得到0的玩家的期望收益:有一半的可能性得到v(k)。

(14)v(0)=12δv(k)

计算结果:

(15)k=4δ24+2δδ2v(k)=24+2δδ2

说明了

  • δ>31时,冒险方案更好。

参照

posted @   SNYang  阅读(1377)  评论(0编辑  收藏  举报
编辑推荐:
· 开发者必知的日志记录最佳实践
· SQL Server 2025 AI相关能力初探
· Linux系列:如何用 C#调用 C方法造成内存泄露
· AI与.NET技术实操系列(二):开始使用ML.NET
· 记一次.NET内存居高不下排查解决与启示
阅读排行:
· 阿里最新开源QwQ-32B,效果媲美deepseek-r1满血版,部署成本又又又降低了!
· Manus重磅发布:全球首款通用AI代理技术深度解析与实战指南
· 开源Multi-agent AI智能体框架aevatar.ai,欢迎大家贡献代码
· 被坑几百块钱后,我竟然真的恢复了删除的微信聊天记录!
· AI技术革命,工作效率10个最佳AI工具
点击右上角即可分享
微信分享提示