读书笔记: 博弈论导论 - 15 - 不完整信息的动态博弈 序贯理性
读书笔记: 博弈论导论 - 15 - 不完整信息的动态博弈 序贯理性
在不完整信息中的序贯理性(Sequential Rationality with Incomplete Information)
本文是Game Theory An Introduction (by Steven Tadelis) 的学习笔记。
子博弈精炼(subgame perfection)
序贯理性就是要求玩家总是选择最佳反应。
子博弈精炼是要求玩家在每个信息集上总是选择最佳反应。
-
在均衡路径上(on the equilibrium path), 不在均衡路径上(off the equilibrium path)
\(\sigma^* = (\sigma_1^*, \cdots, \sigma_n^*)\)是一个不完整信息博弈的贝叶斯纳什均衡。
我们说一个信息集在均衡路径上(on the equilibrium path),如果给定的\(\sigma^*\)和类型分布,这个信息集有正可能性到达。
我们说一个信息集不在均衡路径上(off the equilibrium path),如果给定的\(\sigma^*\)和类型分布,这个信息集被到达的可能性为0。 -
信念体系
一个信念体系\(\mu\),在一个扩展形式博弈中,给每个信息集的每个决策点(decision node)都分配了一个概率。
- 贝叶斯规则(Bayes' Rule)
\(\Pr \{A|B \} = \frac{\Pr \{A \land B \} }{\Pr \{A \land B \} + \Pr \{\lnot A \land B \}}\)
精炼贝叶斯均衡(perfect Bayesian equilibrium)的四个需求:
-
需求 15.1
每个玩家在每个信息集上,都将有一个意义明确的信念(关于他的位置)。也就是说博弈将有一个信念体系。 -
需求 15.2
\(\sigma^* = (\sigma_1^*, \cdots, \sigma_n^*)\)是一个不完整信息博弈的贝叶斯纳什均衡,我们要求在所有信息集上,在均衡路径上的信念符合贝叶斯规则。 -
需求 15.3
对于不在均衡路径上的信息集,其信念值可以是任何值。 -
需求 15.4
给定玩家的信念,玩家的策略必须是序贯理性。也就是说在每一个信息集上,玩家将选择信念对应的最佳反应。 -
精炼贝叶斯均衡(perfect Bayesian equilibrium)
如果满足需求15.1 ~ 15.4, 一个贝叶斯纳什均衡\(\sigma^* = (\sigma_1^*, \cdots, \sigma_n^*)\)和一个信念体系\(\mu^*\)构成一个精炼贝叶斯均衡。
精炼贝叶斯均衡也是贝叶斯纳什均衡和子博弈精炼均衡。
推论 15.1
一个(可能是混合的)策略组合\(\sigma^* = (\sigma_1^*, \cdots, \sigma_n^*)\)是一个贝叶斯博弈\(\Gamma\)的贝叶斯纳什均衡,
如果策略组合\(\sigma^*\)能使所有的信息集都有具有可能性到达,
则策略组合\(\sigma^*\)和(从这个策略组合\(\sigma^*\)和类型的概率分布获得的)信仰系统\(\mu^*\)一起,
就构成了一个精炼贝叶斯均衡(perfect Bayesian equilibrium)。
序贯均衡(Sequential Equilibrium)
- 一致的策略组合和信念体系
一个策略组合\(\sigma^* = (\sigma_1^*, \cdots, \sigma_n^*)\)和一个信念体系\(\mu^*\)是一致的,
如果存在一系列的非退化的混合策略组合\(\{ \sigma^k \}_{k=1}^{\infty}\)和一系列(根据贝叶斯规则获得的)信任\(\{ \mu^k \}_{k=1}^{\infty}\),
有\(\lim_{k \to \infty} (\sigma^k, \mu^k) = (\sigma^*, \mu^*)\)。
解释:
这里的意思是:策略组合和信念体系可以互相迭代求解(也可以理解为一个序贯均衡的求解方式)
策略应该简单地最大化每个信息集的预期收益。
那些在策略中得到正概率的信息集合的合理信念,应该是信息集合节点上的条件概率分布(根据贝叶斯规则)。
- 序贯均衡(Sequential Equilibrium)
一个策略组合\(\sigma^* = (\sigma_1^*, \cdots, \sigma_n^*)\)和一个信念体系\(\mu^*\)是一个序贯均衡,
如果\((\sigma^*, \mu^*)\)是一个一致的精炼贝叶斯均衡。
解释:
序贯均衡是一个精炼贝叶斯均衡。
而一个精炼贝叶斯均衡的策略组合和信念体系是一致的(根据一致性推导所得),这个精炼贝叶斯均衡才是一个序贯均衡。
序贯均衡由于难以应用,较少被使用。
参照
- Game Theory An Introduction (by Steven Tadelis)
- 读书笔记: 博弈论导论 - 01 - 单人决策问题
- 读书笔记: 博弈论导论 - 02 - 引入不确定性和时间
- 读书笔记: 博弈论导论 - 03 - 完整信息的静态博弈 预备知识
- 读书笔记: 博弈论导论 - 04 - 完整信息的静态博弈 理性和公共知识
- 读书笔记: 博弈论导论 - 05 - 完整信息的静态博弈 纳什均衡
- 读书笔记: 博弈论导论 - 06 - 完整信息的静态博弈 混合的策略
- 读书笔记: 博弈论导论 - 07 - 完整信息的动态博弈 预备知识
- 读书笔记: 博弈论导论 - 08 - 完整信息的动态博弈 可信性和序贯理性
- 读书笔记: 博弈论导论 - 09 - 完整信息的动态博弈 多阶段博弈
- 读书笔记: 博弈论导论 - 10 - 完整信息的动态博弈 重复的博弈
- 读书笔记: 博弈论导论 - 11 - 完整信息的动态博弈 战略协议
- 读书笔记: 博弈论导论 - 12 - 不完整信息的静态博弈 贝叶斯博弈
- 读书笔记: 博弈论导论 - 13 - 不完整信息的静态博弈 拍卖和竞标
- 读书笔记: 博弈论导论 - 14 - 不完整信息的静态博弈 机制设计
- 读书笔记: 博弈论导论 - 15 - 不完整信息的动态博弈 序贯理性
- Nash bargaining solution
- Mechanism design
- Sequential equilibrium
请“推荐”本文!