读书笔记: 博弈论导论 - 06 - 完整信息的静态博弈 混合的策略
读书笔记: 博弈论导论 - 06 - 完整信息的静态博弈 混合的策略
混合的策略
本文是Game Theory An Introduction (by Steven Tadelis) 的学习笔记。
策略,信念和期望收益
- 混合策略
玩家i的有限纯策略集合。
将定义为的单纯形,是在上所有概率分布的集合。
玩家i的一个混合策略(mixed strategy)是,
两个明显的条件:
-
的例子:(rock-paper-scissor)
= {(\sigma_i(R), \sigma_i(P), \sigma_i(S)) : \sigma_i(R), \sigma_i(P), \sigma_i(S) \geq 0, \sigma_i(R) + \sigma_i(P) + \sigma_i(S) = 1}(\sigma_i(R), \sigma_i(P), \sigma_i(S))$对,使得每个值都大于等于0,并且每个值的和为1。 -
支持策略( is in the support of )
给定一个玩家i的混合策略,如果,则称支持纯策略。 -
连续策略集的混合策略
玩家i的纯策略集合是一个值区间,则玩家i的一个混合策略是累积分布函数。
如果在密度上可微分,并且,则称支持纯策略。 -
信念(belief)
信念代表玩家i认为对手采用的概率。 -
期望收益(Expected Payoffs)
玩家i选择策略,并且对手选择混合策略,的期望收益:
玩家i选择混合策略,并且对手选择混合策略,的期望收益:
- 混合策略的纳什均衡
混合策略组合是一个纳什策略,如果对于每个玩家都是最佳响应。
推论 6.1
如果是一个纳什博弈,并且s_is'iv_i(s_i, \sigma^) = v_i(s'i, \sigma^) = v_i(\sigma^, \sigma_{-i}^)$
Rock-Paper-Scissor
断言 6.1:
如果一个玩家选择纯策略,另一个玩家选择混合策略,则不存在纳什均衡。
断言 6.2:
如果至少有一个玩家选择只有两个纯策略的混合策略,则不存在纳什均衡。
严格劣势策略的迭代消除和可合理化(IESDS and Rationalizability)
- 严格劣势
严格劣势于,如果满足条件:
- 不可能是一个最佳响应
对于玩家i的混合策略,这个混合策略作为最佳响应的对手混合策略,如果对手的任何混合策略都不在玩家i的信念中,则不可能是一个最佳响应。
断言
一个劣势混合策略不可能是一个最佳响应。
推论 6.2
任何两人博弈中,策略是一个严格劣势纯策略,当且仅当策略不可能是一个最佳响应。
纳什存在定理
纳什存在定理(Nash's existence Theorem)
任何普通形式、具有限策略集合的博弈存在一个纳什均衡的混合策略。
纳什存在定理的证明用到了不动点定理。
布劳威尔不动点定理(Brouwer's Fixed-Point Theorem)
如果f(x)是一个连续函数从域[0, 1]到[0, 1],则存在至少一个点。
证明过程简介:连续函数f(x)一定和函数至少有一个交点。
- 最佳响应对应(collection of best response correspondence)
最佳响应对应集合,映射 到自身。
也就是说:,
角谷不动点定理(Kakutani Fixed-Point Theorem)
一个对应有一个不动点,如果以下四个条件都满足:
- X是非空的,紧凑的,的凸子集
- C(x)对于所有的x都非空。
- C(x)对于所有的x都是凸的。
- C有一个闭合图。
- 凸的(convex)
集合是凸的,如果集合X中任何两点的连线上的点都在集合X中。 - 闭合的(closed)
集合是闭合的,如果集合X边缘点在集合X中。(0, 1]是非闭合的,[0, 1]是闭合的。 - 紧凑的(compact)
集合是紧凑的,如果集合X是闭合并且有界。[0, 1]是紧凑的,是非紧凑的。 - 闭合图(closed graph)
图是闭合图, 如果C是闭合的。
参照
- Game Theory An Introduction (by Steven Tadelis)
请“推荐”本文!
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· 开发者必知的日志记录最佳实践
· SQL Server 2025 AI相关能力初探
· Linux系列:如何用 C#调用 C方法造成内存泄露
· AI与.NET技术实操系列(二):开始使用ML.NET
· 记一次.NET内存居高不下排查解决与启示
· 阿里最新开源QwQ-32B,效果媲美deepseek-r1满血版,部署成本又又又降低了!
· Manus重磅发布:全球首款通用AI代理技术深度解析与实战指南
· 开源Multi-agent AI智能体框架aevatar.ai,欢迎大家贡献代码
· 被坑几百块钱后,我竟然真的恢复了删除的微信聊天记录!
· AI技术革命,工作效率10个最佳AI工具