博弈论2 零和游戏
Zero Sum Games
即原本讨论的收益矩阵有两个,分别对应于玩家1和玩家2。零和游戏保证了 ,这说明只需要一个唯一的矩阵即可建模游戏收益,通常规定为玩家1的收益
考虑一个混合策略outcome ,对于玩家1而言收益就是 ,玩家2就是 。对于纯策略只需要让概率分布坍缩为一个点就行了。
Min-Max
以下只讨论玩家1,玩家2是类似的。
对于任意的玩家2的混合策略 ,玩家1必然会选择使得 最大化的 ,即
而对于任意玩家1的混合策略 ,玩家2必然会选择使得 最小化的 ,这说明
定理1
证明比较玄妙,就是一堆绕来绕去的min-max
首先对于 将其视为关于 的函数,那么有函数在任意点处的函数值不小于其最小值
此时将 和 视为 的函数,那么两侧加上关于 的最大值仍然成立
此时RHS是一个数,LHS是一个关于 的函数,这说明函数的最小值至少为RHS,即
定理2
若 分别是min-max和max-min时,有如下定理:
是MNE当且仅当它们得到的收益相等。
证明是某次作业
定理3
有限策略游戏的混合策略纳什均衡必然存在。
这说明必然存在 这样的均衡局面,且这样的局面分别是min-max和max-min
定理4
在对称零和游戏中,均衡点必然收益为 。
这是显然的,对称零和说明 ,即对角线上收益为 。对于正收益的局面,玩家2总能移动到对角线上获得一个更高的收益;负收益局面玩家1同理。
求解
对于玩家1而言即为求解 ,可以等价地转化为如下线性规划:
本文来自博客园,作者:jjppp。本博客所有文章除特别声明外,均采用CC BY-SA 4.0 协议
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· TypeScript + Deepseek 打造卜卦网站:技术与玄学的结合
· Manus的开源复刻OpenManus初探
· AI 智能体引爆开源社区「GitHub 热点速览」
· 从HTTP原因短语缺失研究HTTP/2和HTTP/3的设计差异
· 三行代码完成国际化适配,妙~啊~