读书笔记: 博弈论导论 - 06 - 完整信息的静态博弈 混合的策略

读书笔记: 博弈论导论 - 06 - 完整信息的静态博弈 混合的策略

混合的策略

本文是Game Theory An Introduction (by Steven Tadelis) 的学习笔记。

策略,信念和期望收益

  • 混合策略
    玩家i的有限纯策略集合Si=si1,si2,,sim
    ΔSi定义为Si的单纯形,是在Si上所有概率分布的集合。
    玩家i的一个混合策略(mixed strategy)是σiΔSi

(1)σi=(σi(si1),σi(si2),,σi(sim))whereσi(si) : the probability that player i plays s_{i}

两个明显的条件:

(2)σi(si)0,siSisiSiσi(si)=1

  • ΔSi的例子:(rock-paper-scissor)
    ΔSi = {(\sigma_i(R), \sigma_i(P), \sigma_i(S)) : \sigma_i(R), \sigma_i(P), \sigma_i(S) \geq 0, \sigma_i(R) + \sigma_i(P) + \sigma_i(S) = 1}(\sigma_i(R), \sigma_i(P), \sigma_i(S))$对,使得每个值都大于等于0,并且每个值的和为1。

  • σ()˙支持策略si(si is in the support of σ()˙)
    给定一个玩家i的混合策略σ()˙,如果σ(si)>0,则称σ()˙支持纯策略si

  • 连续策略集的混合策略
    玩家i的纯策略集合Si是一个值区间,则玩家i的一个混合策略是累积分布函数Fi:Si[0,1], where Fi(x)=Prsi<x>
    如果Fi()˙在密度fi()˙上可微分,并且fi()˙>0,则称Fi()˙支持纯策略si

  • 信念(belief)
    信念πiΔSi代表玩家i认为对手采用siSi的概率。

  • 期望收益(Expected Payoffs)
    玩家i选择策略siSi,并且对手选择混合策略σi Δi,的期望收益:

(3)vi(si,σi)=siSiσi(si)vi(si,si)

玩家i选择混合策略σiΔSi,并且对手选择混合策略σi Δi,的期望收益:

(4)vi(σi,σi)=siSiσi(si)vi(si,si)=siSi(siSiσi(si)σi(si)vi(si,si))

  • 混合策略的纳什均衡
    混合策略组合σ=(σ1,σ2,,σn)是一个纳什策略,如果对于每个玩家σi都是最佳响应。

(5)vi(σi,σi)vi(σi,σi), σiΔSi

推论 6.1

如果σ是一个纳什博弈,并且σs_is'i,v_i(s_i, \sigma^) = v_i(s'i, \sigma^) = v_i(\sigma^, \sigma_{-i}^)$

Rock-Paper-Scissor

断言 6.1:

如果一个玩家选择纯策略,另一个玩家选择混合策略,则不存在纳什均衡。

断言 6.2:

如果至少有一个玩家选择只有两个纯策略的混合策略,则不存在纳什均衡。

严格劣势策略的迭代消除和可合理化(IESDS and Rationalizability)

  • 严格劣势
    siSi严格劣势于σiΔSi,如果满足条件:

(6)vi(σi,si)>vi(si,si), siSi

  • 不可能是一个最佳响应
    对于玩家i的混合策略σiΔSi,这个混合策略作为最佳响应的对手混合策略σiBRi(σ1),如果对手的任何混合策略σ1ΔSi都不在玩家i的信念中,则σiΔSi不可能是一个最佳响应。

断言

一个劣势混合策略sigmai不可能是一个最佳响应。

推论 6.2

任何两人博弈中,策略sigmai是一个严格劣势纯策略,当且仅当策略sigmai不可能是一个最佳响应。

纳什存在定理

纳什存在定理(Nash's existence Theorem)

任何普通形式、具有限策略集合的博弈存在一个纳什均衡的混合策略。
纳什存在定理的证明用到了不动点定理。

布劳威尔不动点定理(Brouwer's Fixed-Point Theorem)

如果f(x)是一个连续函数从域[0, 1]到[0, 1]f:[0,1][0,1],则存在至少一个点f(x)=x,x[0,1]
证明过程简介:连续函数f(x)一定和函数f1(x)=x至少有一个交点。

  • 最佳响应对应(collection of best response correspondence)
    最佳响应对应集合BRBR1×BR2××BRn,映射ΔSΔS1×ΔS2××ΔSn 到自身。
    也就是说:BR:ΔSΔS, BR(σ)ΔS, for σΔS

角谷不动点定理(Kakutani Fixed-Point Theorem)

一个对应C:XX有一个不动点,如果以下四个条件都满足:

  1. X是非空的,紧凑的,Rn的凸子集
  2. C(x)对于所有的x都非空。
  3. C(x)对于所有的x都是凸的。
  4. C有一个闭合图。
  • 凸的(convex)
    集合XRn是凸的,如果集合X中任何两点的连线上的点都在集合X中。
  • 闭合的(closed)
    集合XRn是闭合的,如果集合X边缘点在集合X中。(0, 1]是非闭合的,[0, 1]是闭合的。
  • 紧凑的(compact)
    集合XRn是紧凑的,如果集合X是闭合并且有界。[0, 1]是紧凑的,[0,]是非紧凑的。
  • 闭合图(closed graph)
    C:XX是闭合图, 如果C是闭合的。

参照

  • Game Theory An Introduction (by Steven Tadelis)
posted @   SNYang  阅读(2676)  评论(0编辑  收藏  举报
编辑推荐:
· 开发者必知的日志记录最佳实践
· SQL Server 2025 AI相关能力初探
· Linux系列:如何用 C#调用 C方法造成内存泄露
· AI与.NET技术实操系列(二):开始使用ML.NET
· 记一次.NET内存居高不下排查解决与启示
阅读排行:
· 阿里最新开源QwQ-32B,效果媲美deepseek-r1满血版,部署成本又又又降低了!
· Manus重磅发布:全球首款通用AI代理技术深度解析与实战指南
· 开源Multi-agent AI智能体框架aevatar.ai,欢迎大家贡献代码
· 被坑几百块钱后,我竟然真的恢复了删除的微信聊天记录!
· AI技术革命,工作效率10个最佳AI工具
点击右上角即可分享
微信分享提示