读书笔记: 博弈论导论 - 09 - 完整信息的动态博弈 多阶段博弈
多阶段博弈(Multistage Games)
本文是Game Theory An Introduction (by Steven Tadelis) 的学习笔记。
多阶段博弈
v i = v 1 i + δ 1 v 2 i + δ 2 v 3 i + ⋯ + δ T − 1 v T i = T ∑ t = 1 δ t − 1 v t i w h e r e δ : discount rate (1) (1) v i = v i 1 + δ 1 v i 2 + δ 2 v i 3 + ⋯ + δ T − 1 v i T = ∑ t = 1 T δ t − 1 v i t w h e r e δ : discount rate
S i = s 1 i , s 2 i ( h 1 ) , ⋯ , s t i ( h t − 1 ) , ⋯ , s T i ( h T − 1 ) w h e r e h t − 1 : a particular outcome that occurred up to period t, not including period t. or information set s t i ( h t − 1 ) : an action for player i from the t th stage-game. h t − 1 = ( ( a 1 1 , ⋯ , a 1 n ) , ⋯ , ( a t − 1 1 , ⋯ , a t − 1 n ) ) (2) (2) S i = s i 1 , s i 2 ( h 1 ) , ⋯ , s i t ( h t − 1 ) , ⋯ , s i T ( h T − 1 ) w h e r e h t − 1 : a particular outcome that occurred up to period t, not including period t. or information set s i t ( h t − 1 ) : an action for player i from the t th stage-game. h t − 1 = ( ( a 1 1 , ⋯ , a n 1 ) , ⋯ , ( a 1 t − 1 , ⋯ , a n t − 1 ) )
多阶段博弈:混合策略(mixed strategy)
σ i = σ 1 i , σ 2 i ( h 1 ) , ⋯ , σ t i ( h t − 1 ) , ⋯ , σ T i ( h T − 1 ) w h e r e h t − 1 : a particular outcome that occurred up to period t, not including period t. or information set σ t i ( h t − 1 ) : an randomization over player i's actions from the t th stage-game. (3) (3) σ i = σ i 1 , σ i 2 ( h 1 ) , ⋯ , σ i t ( h t − 1 ) , ⋯ , σ i T ( h T − 1 ) w h e r e h t − 1 : a particular outcome that occurred up to period t, not including period t. or information set σ i t ( h t − 1 ) : an randomization over player i's actions from the t th stage-game.
推论9.1
在一个T阶段的多阶段博弈中,σ t ∗ σ t ∗ 是第t个阶段的一个纳什均衡。
则在这个多阶段博弈中存在一个子博弈精炼均衡,其均衡路径一致于σ 1 ∗ , σ 2 ∗ , ⋯ , σ T ∗ σ 1 ∗ , σ 2 ∗ , ⋯ , σ T ∗ 产生的路径。
推论9.2
在一个由阶段博弈G 1 , G 2 , ⋯ , G T G 1 , G 2 , ⋯ , G T T组成的多阶段博弈中,σ ∗ σ ∗ 是一个纳什均衡,
则在期间T(最后一个)的阶段博弈中,σ ∗ σ ∗ 的约束一定是这个阶段博弈的纳什均衡。
最后一个博弈不存在依赖性。
后面的博弈如果有多个纳什均衡,则可能会影响前面阶段的博弈结果。(胡萝卜大棒理论)
推论9.3
在一个由有限个阶段博弈组成的多阶段博弈中,每个阶段博弈都有一个唯一的纳什均衡,
则这个多阶段博弈有一个唯一的子博弈精炼均衡。
单阶段偏差原理(The One-Stage Deviation Principle)
单阶段偏差原理用来简化有多个阶段博弈的计算过程。
单阶段不可改善的策略(one-stage un-improvable strategy)
一个策略是单阶段不可改善的,如果不存在h i , a ∈ A i ( h i ) h i , a ∈ A i ( h i )
v_i(\sigma_i^{a,h_i}, h_i) > v_i(\sigma_i, h_i) \\ where \\ \sigma_i^{a,h_i} \text{: is identical to } \sigma_i \text{ everywhere except at } h_i. $$。 **定理:9.1** > 一个单阶段不可改善的策略一定是最优的。 ## 参照 - Game Theory An Introduction (by Steven Tadelis) - [读书笔记: 博弈论导论 - 01 - 单人决策问题](http://www.cnblogs.com/steven-yang/p/8075901.html) - [读书笔记: 博弈论导论 - 02 - 引入不确定性和时间](http://www.cnblogs.com/steven-yang/p/8075907.html) - [读书笔记: 博弈论导论 - 03 - 完整信息的静态博弈 预备知识](http://www.cnblogs.com/steven-yang/p/8075913.html) - [读书笔记: 博弈论导论 - 04 - 完整信息的静态博弈 理性和公共知识](http://www.cnblogs.com/steven-yang/p/8088030.html) - [读书笔记: 博弈论导论 - 05 - 完整信息的静态博弈 纳什均衡](http://www.cnblogs.com/steven-yang/p/8110191.html) - [读书笔记: 博弈论导论 - 06 - 完整信息的静态博弈 混合的策略](http://www.cnblogs.com/steven-yang/p/8118418.html) - [读书笔记: 博弈论导论 - 07 - 完整信息的动态博弈 预备知识](http://www.cnblogs.com/steven-yang/p/8177451.html) - [读书笔记: 博弈论导论 - 08 - 完整信息的动态博弈 可信性和序贯理性](http://www.cnblogs.com/steven-yang/p/8183803.html) v_i(\sigma_i^{a,h_i}, h_i) > v_i(\sigma_i, h_i) \\where \\\sigma_i^{a,h_i} \text{: is identical to } \sigma_i \text{ everywhere except at } h_i.$$。**定理:9.1**> 一个单阶段不可改善的策略一定是最优的。## 参照- Game Theory An Introduction (by Steven Tadelis)- [读书笔记: 博弈论导论 - 01 - 单人决策问题](http://www.cnblogs.com/steven-yang/p/8075901.html)- [读书笔记: 博弈论导论 - 02 - 引入不确定性和时间](http://www.cnblogs.com/steven-yang/p/8075907.html)- [读书笔记: 博弈论导论 - 03 - 完整信息的静态博弈 预备知识](http://www.cnblogs.com/steven-yang/p/8075913.html)- [读书笔记: 博弈论导论 - 04 - 完整信息的静态博弈 理性和公共知识](http://www.cnblogs.com/steven-yang/p/8088030.html)- [读书笔记: 博弈论导论 - 05 - 完整信息的静态博弈 纳什均衡](http://www.cnblogs.com/steven-yang/p/8110191.html)- [读书笔记: 博弈论导论 - 06 - 完整信息的静态博弈 混合的策略](http://www.cnblogs.com/steven-yang/p/8118418.html)- [读书笔记: 博弈论导论 - 07 - 完整信息的动态博弈 预备知识](http://www.cnblogs.com/steven-yang/p/8177451.html)- [读书笔记: 博弈论导论 - 08 - 完整信息的动态博弈 可信性和序贯理性](http://www.cnblogs.com/steven-yang/p/8183803.html)
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· 开发者必知的日志记录最佳实践
· SQL Server 2025 AI相关能力初探
· Linux系列:如何用 C#调用 C方法造成内存泄露
· AI与.NET技术实操系列(二):开始使用ML.NET
· 记一次.NET内存居高不下排查解决与启示
· 阿里最新开源QwQ-32B,效果媲美deepseek-r1满血版,部署成本又又又降低了!
· Manus重磅发布:全球首款通用AI代理技术深度解析与实战指南
· 开源Multi-agent AI智能体框架aevatar.ai,欢迎大家贡献代码
· 被坑几百块钱后,我竟然真的恢复了删除的微信聊天记录!
· AI技术革命,工作效率10个最佳AI工具