读书笔记: 博弈论导论 - 14 - 不完整信息的静态博弈 机制设计

读书笔记: 博弈论导论 - 14 - 不完整信息的静态博弈 机制设计

机制设计(Mechanism Design)

本文是Game Theory An Introduction (by Steven Tadelis) 的学习笔记。

机制设计的概念

机制设计的目标是设计一个可以达到期望收益的博弈。
由于这是根据博弈结果来推导博弈的形式,也被称为反向博弈论(reverse game theory)。
这个理论明显在经济和政治方面有很多用途。
我们假象这样一个例子:

某个政府需要设计一个关于化工厂的环保政策。
这个政策可能涉及到:几个化工厂、政府和大众。
大概的想法是:政府有一些排放许可;化工厂需要从政府那里买排放许可;政府和大众利用获得的资金改善环境。
机制设计的核心是:制定玩家的行动和支付资金的关系。

从上面的例子可以看出一些新的元素:

  • 排放许可
    在理论中称之为替代选择(alternatives),或者叫做公共物品(public good)。
  • 资金的转移(monetary transfer)

新的概念:

  • 机制设计者(mechanism designer)
    也称为中央集权(central authority)。中央集权不一定是玩家。
  • 替代选择(alternatives)或者公共物品(public good)
    中央集权提供的公共物品或者服务。
    将成为玩家的结果(outcome)的一部分。
  • 资金的转移(monetary transfer)
    每个玩家获得的资金。负数表示支付的资金,
    成为收益函数的一部分。
  • 收益函数
    在机制设计中,玩家的结果包含两部分:公共物品和资金的转移。
    另外,我们简单地加上资金部分作为收益。
    所以收益函数变为:

(1)vi(x,mi,θi)=u(x,θi)+mi

  • 所有玩家的一个结果组合(outcomes)
    这里用y来表示,以区分x。

(2)y=(x,m1,,mn):xX,miR iN,i=1nmi0yi=(xi,mi)

  • 选择规则(choice rule)
    根据类型θ得到机制的结果y

(3)f(θ)=(x(θ),m1(θ),,mn(θ))wherex(θ)(:decisionrule)(m1(θ),,mn(θ))(:transferrule)

选择条件定义了每个类型想要的结果。

机制设计者面临的问题和一个方向

机制设计者面临的问题和一个方向

在不完整信息博弈中,私有信息(机制设计者不知道的信息):

  • 每个玩家的类型θ
    公共知识:
  • 类型集合Θ
  • 每种类型的选择规则,也就是每种类型玩家倾向的结果
  • 每种类型的策略,就是每种类型玩家的倾向策略
  • 策略行动导致的结果。

机制设计的两个方向之一,是在不知道玩家的类型(这是私有信息)的情况下,
设计出一个足够聪明的博弈,能够保证:

  • 对于每种类型的玩家组合,其选择规则的结果,和博弈的贝叶斯纳什均衡的结果一致。
    也就是说,其选择规则结果和博弈的策略引起的结果一致。
    满足上面条件的机制,则称之实现了选择规则。
    下面是相应的数学说明。
  • 机制(mechanism)
    机制规定了玩家的行动集合,以及行动结果与资金转移的关系。

(4)Γ=A1,,An,g()whereg:A1×AnY

  • 玩家i的纯策略
    si:ΘiAi

  • 玩家i的收益函数
    vi(g(s),θi)

  • 贝叶斯纳什均衡(Bayesian Nash Equilibrium)
    如果满足下面条件,一个策略组合s()=(s1(),,sn())
    是一个机制Γ=A1,,An,g()的贝叶斯纳什均衡:

(5)Eθ1[vi(g(si(θi),si(θi)),θi)|θi]Eθ1[vi(g(ai,si(θi)),θi)|θi],aiAi,iN,θiΘi

也就是说,对于每种类型组合,每个玩家,当对手的策略是这个策略组合时,这个玩家的这个策略组合的策略是最优的(其期望收益大于等于其它的所有策略的期望收益)。

  • 机制实现选择规则
    如果满足下面条件,则这个机制Γ实现了(implement)选择规则f():
    存在一个贝叶斯纳什均衡s(s1(θ1),,sn(θn)),满足:

(6)g(s1(θ1),,sn(θn))=f(θ),θiΘi

  • 部分实现(partial implementation)和完全实现(full implementation)
    除了期望的贝叶斯纳什均衡,如果允许存在其它的、不期望的均衡,成为部分实现;
    如果不允许存在其它的、不期望的均衡,成为完全实现;

揭露原理(the revelation principle)

机制设计的另外一个方向:玩家意识到机制设计者会实现他的选择条件f()时,玩家会透露自己的类型。

  • 直接揭露机制(direct revelation mechanism)
    一个选择规则f()的直接揭露机制Γ=Θ1,,Θn,f()是:

(7)Ai=Θi,iNg(θ)=f(θ),θΘ

解释:

对于每个玩家,其行动集合Θ是选择规则Θi对应的行动集合(想象一下,每个类型对应一个策略,一个策略对应一个行动)。
对于每个类型θ,它的选择规则(想要的)结果f(θ)和机制设计的结果g(θ)一致。

  • 在贝叶斯纳什均衡中诚实地可实现的(truthfully implementable in Bayesian Nash equilibrium)
    一个选择规则f()是在贝叶斯纳什均衡中诚实地可实现的,
    如果这个选择规则的直接揭露机制Γ=Θ1,,Θn,f()有一个贝叶斯纳什均衡si(θi)=θi,
    也就是说,满足:

(8)Eθ1[vi(f(θi,θi),θi)|θi]Eθ1[vi(g(θi,θi),θi)|θi],θiΘi

解释:

当解释规则的直接揭露机制有有一个贝叶斯纳什均衡解,则其实完全可满足的。

推论 14.1 : 对于贝叶斯纳什实现的揭露原理
一个选择规则f()在贝叶斯纳什均衡中是可实现的,当且仅当它在贝叶斯纳什均衡中诚实地可实现的(truthfully implementable in Bayesian Nash equilibrium)。

揭露原理的想法:

在均衡中,玩家知道这个机制实现了选择规则f(),所以会何其保持一致。
因此他们可能会诚实地述说他们的类型,让机制设计者直接实现选择规则f()

优势策略和Vickrey-Clarke-Groves机制

  • 优势策略
    如果满足以下条件,则策略组合s()=(s1(),,sn())是一个机制Γ=A1,,An,g()的优势策略:

(9)vi(g(si(θ),ai),θi)vi(g(ai,ai),θi),aiAi,aiAi,iN,θiΘi

同时,揭露原理意味着如果选择法则f()如果一个选择规则可以被一个优势策略实现,我们只要检测这个选择法则是在优势策略中诚实地可实现的。
即:

(10)vi(f(θi,θi),θi)vi(f(θi,θi),θi),θiΘi,θiΘi,iN,θiΘi

推论 14.2
在一个准线性(quasilinear)环境中,给定一个实例状态θΘ
一个替代物(alternative)xX是一个帕累托优化,当且仅当下面有一个解:

(11)maxxXi=1Iui(xi,θi)

  • First-best decision rule
    如果对于 θΘ, x(θ)都是帕累托优化的,则x()为First-best decision rule。

  • Vickrey-Clarke-Groves机制
    给定一个宣布的类型θ
    这个选择规则f(θ)=(x(θ),m1(θ),,mn(θ))是一个Vickrey-Clarke-Groves机制,
    如果x()是一个第一好决定规则(first-best decision rule),并且:

(12)mi(θ)=jiuj(x(θj,θi),θj)+hi(θi)wherehi(θi) is an arbitrary function of θi

解释:

没有完全看懂。大概的意思是对于First-best decision rule x()
可以找到一个转移规则(m1(),,mn())
让选择规则成为一个在优势策略中可实现。

下面是一个解:

  • Pivotal Mechanism - a particular form of Vickrey-Clarke-Groves机制

(13)hi(θi)=jiuj(xi(θi),θj)wherexi(θi)argmaxxXjiuj(x,θj)Thusmi(θ)=jiuj(x(θj,θi),θj)jiuj(xi(θi),θj)

参照

posted @   SNYang  阅读(2810)  评论(0编辑  收藏  举报
编辑推荐:
· 开发者必知的日志记录最佳实践
· SQL Server 2025 AI相关能力初探
· Linux系列:如何用 C#调用 C方法造成内存泄露
· AI与.NET技术实操系列(二):开始使用ML.NET
· 记一次.NET内存居高不下排查解决与启示
阅读排行:
· 阿里最新开源QwQ-32B,效果媲美deepseek-r1满血版,部署成本又又又降低了!
· Manus重磅发布:全球首款通用AI代理技术深度解析与实战指南
· 开源Multi-agent AI智能体框架aevatar.ai,欢迎大家贡献代码
· 被坑几百块钱后,我竟然真的恢复了删除的微信聊天记录!
· AI技术革命,工作效率10个最佳AI工具
点击右上角即可分享
微信分享提示