读书笔记: 博弈论导论 - 18 - 不完整信息的动态博弈 信息传递和廉价谈判

读书笔记: 博弈论导论 - 18 - 不完整信息的动态博弈 信息传递和廉价谈判

信息传递和廉价谈判(Information Transmission and Cheap Talk)

本文是Game Theory An Introduction (by Steven Tadelis) 的学习笔记。

这里讨论的问题是:玩家1是信息提供者,玩家2是决策者。
玩家1和玩家2的收益函数有一个偏差。着导致玩家1并不一定会提供真实的信息。
而玩家2则需要根据玩家1的类型来做出决策。

三个结论:

  • 不存在完全诚实的均衡。(或者可以理解为存在一个不诚实的均衡。)
  • 总是存在一个瞎说的均衡(babbling equilibrium)。玩家1没有提供任何有用的信息,玩家2使用先验信念来计算其最大收益。
  • 如果玩家1的偏差不是太大,则在均衡中部分信息能够被真实传递。

两信息博弈

案例:
玩家1了解真实的情况,θ[0,1]为两个值中之一。
玩家2的先验知识是这两种状态的可能性一样。
玩家2的行动a2R,其收益函数为v2(a2,θ)=(θa2)2,意味着玩家2的最优策略是a2=θ
玩家1的行动a1,其收益函数为v1(a2,θ)=(θ+ba2)2,b>0,意味着玩家2的最优策略是a2=θ+b
事件的顺序为:玩家1给玩家2一个消息,然后玩家2决定其策略。

这里增加了一个条件:玩家1只能提供两个信息a{a,a},0a<a1.中的一个。

声明 18.5

在一个两消息均衡中,玩家1一定会使用一个阀值策略:如果0θθ时选择a,如果θθ1时选择a

声明 18.6

在一个两消息均衡中,玩家1使用一个阀值策略,则玩家2最佳反应a2(a1)=θ2a2(a1)=1θ2

声明 18.7

当且仅当b<14时,存在一个两消息精炼贝叶斯均衡。

应用:信息和立法组织

案例:
在一个委员会中,玩家1是一个顾问,提供建议给政策制定者。玩家2制定政策。
玩家1了解真实的情况,θ{w,w},w>0为两个值中之一。
玩家2的先验知识是这两种状态的可能性一样。
玩家2的行动a2,其收益函数为v2(a2,θ)=(θa2)2,意味着玩家2的最优策略是a2=θ
玩家1的行动a1,其收益函数为v1(a2,θ)=(θ+ba2)2,b>0,意味着玩家2的最优策略是a2=θ+b
事件的顺序为:玩家1给玩家2一个消息,然后政策被指定。

解决方案1:
如果玩家2根据先验条件,则会得到a2=0为最大收益的行动。根据a2=0行动指定的策略,称之为现状策略(status quo policy)。
我们可以理解为玩家2没有从玩家1那里得到任何信息。

替代规则

  • 开放规则(open rule)
    玩家2可以选择任何策略。
    此时,玩家2的默认策略是现状策略,如果认为玩家1在瞎扯的是否。
    玩家1要比较瞎扯的结果(现状策略)和一个诚实a2=θ的策略结果。
  • 封闭规则(close rule)
    玩家2可以在现状策略和一个玩家1建议的策略中选择一个。

声明 18.8

在一个开放规则中,当且仅当bw时,存在一个完全诚实的均衡,其中a2=θ

声明 18.9

在一个封闭规则中,当且仅当bw时,存在一个完全诚实的均衡,其中a2=θ+b

声明 18.10

在一个封闭规则中,当且仅当b2w时,存在一个完全诚实的均衡,其中a2=θ+w

结论:

  1. 玩家1的野心越小,越诚实。
  2. 在开放规则中,玩家1的野心较小时,诚实的结果优于现状策略。
  3. 在封闭规则中,玩家1可以从其中获益。

参照

posted @   SNYang  阅读(1980)  评论(0编辑  收藏  举报
编辑推荐:
· 开发者必知的日志记录最佳实践
· SQL Server 2025 AI相关能力初探
· Linux系列:如何用 C#调用 C方法造成内存泄露
· AI与.NET技术实操系列(二):开始使用ML.NET
· 记一次.NET内存居高不下排查解决与启示
阅读排行:
· 阿里最新开源QwQ-32B,效果媲美deepseek-r1满血版,部署成本又又又降低了!
· Manus重磅发布:全球首款通用AI代理技术深度解析与实战指南
· 开源Multi-agent AI智能体框架aevatar.ai,欢迎大家贡献代码
· 被坑几百块钱后,我竟然真的恢复了删除的微信聊天记录!
· AI技术革命,工作效率10个最佳AI工具
点击右上角即可分享
微信分享提示