读书笔记: 博弈论导论 - 08 - 完整信息的动态博弈可信性和序贯理性

可信性和序贯理性(Credibility and Sequential Rationality)

本文是Game Theory An Introduction (by Steven Tadelis) 的学习笔记。

序贯理性(Sequential Rationality)
序贯理性是一个原则：在博弈树的每一个信息集上，玩家总是使用最佳策略。
这意味着，无论是否在均衡路径上，博弈次序的每个阶段，玩家都是在做理智的选择。
序贯理性(Sequential Rationality)
给定玩家i对手的策略组合 $\sigma_{-i} \in \Delta S_{-i}$ ，玩家策略 $\sigma_i$ 是序贯理性的，
当且仅当玩家i在每个信息集上，总是选择 $\sigma_{-i}$ 最佳响应。

方法 - 逆向归纳法解:

从末端节点开始，在上一层的每个节点的收益组合为节点玩家的（子节点的）最佳收益组合。
以此类推，直到根节点。根节点上的收益组合（可能是多个）的博弈路径为逆向归纳法解。

推论8.1 (Zermelo's Theorem)

任何有限完美信息博弈都有一个逆向归纳法解，而且是顺序合理的。
此外，如果没有两个末端节点有（对每个玩家）相同的收益，则逆向归纳法解是唯一的。

推论

任何有限完美信息博弈至少有一个顺序合理的纯策略形式的纳什均衡。
此外，如果没有两个末端节点有（对每个玩家）相同的收益，则有唯一的顺序合理的纳什均衡。

适当的子博弈(proper subgame)
博弈 $\Gamma$ 的一个适当子博弈 $G$ 只包含一个节点和它所有子孙节点，并具有性质：
如果 $s \in G$ 并且 $x' \in h(x)$ ，则 $x' \in G$ - 属于子博弈 $G$ 的节点，这个节点的信息集包含的所有节点都属于这个子博弈 $G$ 。
子博弈精炼均衡(subgame-perfect (Nash) equilibrium)
在一个扩展形式博弈 $\Gamma$ 中，如果对于每一个子博弈 $G$ ， $\sigma^*$ 都是 $G$ 中的纳什均衡，则行为策略组合 $\sigma^* = (\sigma_1^*, \cdots, \sigma_n^*)$ 是一个子博弈精炼均衡。

事实

对于任何有限完美信息博弈，子博弈精炼纳什均衡的集合和逆向归纳法的纳什均衡的集合是一致的。

posted @ 2018-01-03 15:03 SNYang 阅读(3040) 评论(0) 编辑收藏举报