读书笔记: 博弈论导论 - 12 - 不完整信息的静态博弈 贝叶斯博弈

读书笔记: 博弈论导论 - 12 - 不完整信息的静态博弈 贝叶斯博弈

贝叶斯博弈(Bayesian Games)

本文是Game Theory An Introduction (by Steven Tadelis) 的学习笔记。

不完整信息的静态博弈(Incomplete information static games)

不完整信息博弈意味着玩家之间缺乏共识(common knowledge),具体指的是其它对手的行动集、结果集和收益函数等信息。
对不完整信息博弈的处理方法来自于Harsanyi。
他引进了两个概念来解决这个问题。
type space: 将对手隐藏的信息(行动集、结果集和收益函数等)转化为多个types,每个type中的信息都是可知的。
belief: 由于不知道对手的具体type是什么,因此使用分布概率表示对手选择某个type的可能性。
这样就可以通过概率统计来计算可能的收益。

  • 静态不完整信息贝叶斯博弈(static Bayesian game of incomplete information)的normal-form描述

(1)N,{Ai}i=1n,{Θi}i=1n,{vi(;θi),θiΘi}i=1n,{ϕi}i=1nwhereN={1,2,,n} : is the set of playersAi : the action set of player iΘi : the type space of player ivi:A×ΘiR : type dependent pay of function of player iϕ : the belief of player i with respect to the uncertainty over the other players' typesϕ(θi|θi) : the posterior conditional distribution on θi

  • 静态不完整信息贝叶斯博弈处理流程:

    1. 自然选择一个类型组合(profile of types)θ1,θ2,,θn
    2. 每个玩家知道自己θi,使用先前的ϕi来形成对对手type的分布概率。
    3. 玩家选择行动。
    4. 根据玩家们的行动a=(ai,a2,,an),可以或者收益vi(a;θ).
  • 条件概率(conditional probability)
    当事件S发生时,事件H发生的条件概率为:

(2)PrH|S=ϕ(SH)ϕ(S)

  • 静态不完整信息贝叶斯博弈 - 纯策略

(3)N,{Ai}i=1n,{Θi}i=1n,{vi(;θi),θiΘi}i=1n,{ϕi}i=1n

玩家i的一个纯策略si(θi)ai

  • 静态不完整信息贝叶斯博弈 - 混合策略
    玩家i的一个混合策略是一个在纯策略之上的概率分布。

  • 静态不完整信息贝叶斯博弈 - 纯策略贝叶斯纳什均衡(pure-strategy Bayesian Nash equilibrium)
    一个纯策略贝叶斯纳什均衡s=(s1,,sn),如果对于每个玩家i,每个玩家的类型θiΘi,每个行动aiAi,满足:

(4)θiΘiϕi(θi|θi)vi(si(θi),si(θi);θi)θiΘiϕi(θi|θi)vi(ai,si(θi);θi)wherevi(ai,si(θi);θi) : only on type θi, the player i's payoff function

其含义:对于每个玩家,其行动si(θi)的分布概率收益总和总是最大的。

关于这章(甚至整本书),重要的是学会如何使用这些理论,书中提供了很好的示例。但这里就不介绍了。

参照

posted @   SNYang  阅读(6673)  评论(0编辑  收藏  举报
编辑推荐:
· 开发者必知的日志记录最佳实践
· SQL Server 2025 AI相关能力初探
· Linux系列:如何用 C#调用 C方法造成内存泄露
· AI与.NET技术实操系列(二):开始使用ML.NET
· 记一次.NET内存居高不下排查解决与启示
阅读排行:
· 阿里最新开源QwQ-32B,效果媲美deepseek-r1满血版,部署成本又又又降低了!
· Manus重磅发布:全球首款通用AI代理技术深度解析与实战指南
· 开源Multi-agent AI智能体框架aevatar.ai,欢迎大家贡献代码
· 被坑几百块钱后,我竟然真的恢复了删除的微信聊天记录!
· AI技术革命,工作效率10个最佳AI工具
点击右上角即可分享
微信分享提示