读书笔记: 博弈论导论 - 08 - 完整信息的动态博弈 可信性和序贯理性
读书笔记: 博弈论导论 - 08 - 完整信息的动态博弈 可信性和序贯理性
可信性和序贯理性(Credibility and Sequential Rationality)
本文是Game Theory An Introduction (by Steven Tadelis) 的学习笔记。
序贯理性和逆向归纳法(Sequential Rationality and Backward Induction)
-
序贯理性(Sequential Rationality)
序贯理性是一个原则:在博弈树的每一个信息集上,玩家总是使用最佳策略。
这意味着,无论是否在均衡路径上,博弈次序的每个阶段,玩家都是在做理智的选择。 -
序贯理性(Sequential Rationality)
给定玩家i对手的策略组合,玩家策略是序贯理性的,
当且仅当玩家i在每个信息集上,总是选择最佳响应。
方法 - 逆向归纳法解:
从末端节点开始,在上一层的每个节点的收益组合为节点玩家的(子节点的)最佳收益组合。
以此类推,直到根节点。根节点上的收益组合(可能是多个)的博弈路径为逆向归纳法解。
推论8.1 (Zermelo's Theorem)
任何有限完美信息博弈都有一个逆向归纳法解,而且是顺序合理的。
此外,如果没有两个末端节点有(对每个玩家)相同的收益,则逆向归纳法解是唯一的。
推论
任何有限完美信息博弈至少有一个顺序合理的纯策略形式的纳什均衡。
此外,如果没有两个末端节点有(对每个玩家)相同的收益,则有唯一的顺序合理的纳什均衡。
-
适当的子博弈(proper subgame)
博弈的一个适当子博弈只包含一个节点和它所有子孙节点,并具有性质:
如果并且,则 - 属于子博弈的节点,这个节点的信息集包含的所有节点都属于这个子博弈。 -
子博弈精炼均衡(subgame-perfect (Nash) equilibrium)
在一个扩展形式博弈中,如果对于每一个子博弈,都是中的纳什均衡,则行为策略组合是一个子博弈精炼均衡。
事实
对于任何有限完美信息博弈,子博弈精炼纳什均衡的集合和逆向归纳法的纳什均衡的集合是一致的。
参照
- Game Theory An Introduction (by Steven Tadelis)
请“推荐”本文!
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· 开发者必知的日志记录最佳实践
· SQL Server 2025 AI相关能力初探
· Linux系列:如何用 C#调用 C方法造成内存泄露
· AI与.NET技术实操系列(二):开始使用ML.NET
· 记一次.NET内存居高不下排查解决与启示
· 阿里最新开源QwQ-32B,效果媲美deepseek-r1满血版,部署成本又又又降低了!
· Manus重磅发布:全球首款通用AI代理技术深度解析与实战指南
· 开源Multi-agent AI智能体框架aevatar.ai,欢迎大家贡献代码
· 被坑几百块钱后,我竟然真的恢复了删除的微信聊天记录!
· AI技术革命,工作效率10个最佳AI工具