博弈论——不完全信息练习题(十七)

1 两寡头古诺产量竟争模型。
厂商的利润函数为 πi=qi(tiqjqi),i=1,2 。若 t1=1 是两个厂商的共同知识, 而 t2 则是厂商 2 的私人信息, 厂商 1 只知道 t2=3/4t2=4/5, 且 t2 取这两个值的概率相等。若两个厂商同时选择产量, 请找出该博弈的纯策略贝叶斯均衡。
: 假设: 厂商 2 在 t2=3/4 时, 产量为 q2, 利润为 π2;厂商 2 在 t2=4/5 时, 产量为 q2, 利润为 π2
对于厂商 2 来说, 分别具有 50% 的概率得到以下的利润

π2=q2(34q1q2)π2=q2(45q1q2)

对于厂商 1 来说, 利润为

Eπ1=12q1(1q1q2)+12q1(1q1q2)

求解上面三个式子的一阶导数, 并令其为零, 得到

34q12q2=045q12q2=012q112q212q2=0

得到: q1=98240,q2=41240,q2=47240
该博弈的纯战略贝叶斯均衡为, 厂商 1 的产量为 q1=98240, 厂商 2 在 t2=3/4 时, 产量为 q2=41240; 在 t2=4/5 时, 产量为 q2=47240

2 两个厂商生产相同产品在市场上进行竞争性销售。
第 1 个厂商的成本函数为 c1=q1, 其中 q1 为厂商 1 的产量。第 2 个厂 商的成本函数为 c2=cq2, 其中 q2 为厂商 2 的产量, c 为其常数边际成本。两个厂商的固定成本都为零。厂商 2 的边际成本 c 是厂 商 2 的 “私人信息”, 厂商 1 认为 c[12,3/2] 上呈均匀分布。设市场需求函数为 P=4q1q2, 其中 P 为价格, 两个厂商都以其产量 为纯战略, 问纯战略贝叶斯均衡为何?
:考虑到 c[12,3/2] 上呈均匀分布, f(c)=1,E(c)=1232f(c)cdc=1
对于厂商 1,π1=pq1c1=(3q1q2)q1
对于厂商 2,π2=pq2c2=(4q1q2E(c))q2

π2=(3q1q2)q2

对于厂商1,2的利润函数求一阶导数,并令其为零,得到q1=q2=1。该博弈的纯战略贝叶斯均衡为,厂商1,2的产量均为1。

3 完全信息与不完全信息猜硬币博弈。
完全信息猜硬币博弈

H T
H 1, -1 -1, 1
T -1, 1 1, -1

不完全信息静态博弈

假设参与人 i 的私人信息为 ti (i=1,2),且 ti 均服从 [0,x] 上的均匀分布 (x>0),则该不完全信息博弈可表示为:

H T
H 1 + t1, -1 -1, 1 + t2
T -1, 1 1, -1

贝叶斯纳什均衡分析

假设当且仅当 t1c1 时,参与人 1 选择 H;当且仅当 t2c2 时,参与人 2 选择 T。因此在事前,参与人 1 选择正面的概率为 xc1x,参与人 2 选择正面的概率为 c2

对于参与人 1,若选择正面的收益大于或等于选择背面,即:

(1+t1)xc2xc2x(1)xc2x+c2x

我们得到 t12c2xc22=c1

同样对于参与人 2,若选择背面的收益大于或等于选择正面,即:

xc1xc1x(1)xc1x+c1x

我们得到 t22c12=c2

联立两式可得 c1=c2,再代入上式可得:

xc14+x+16+x2=2c12x+2c1=c1xc12

解得 c1

故参与人 1 选择正面的概率为:

xc1x=12+416+x22x

x0,我们得到:

c2x12

4 考虑如下的不完全信息博弈:参与人 1(行参与人)清楚这个 博弈的支付矩阵是 G1 还是 G2(如下表所示),但是参与人 2(列参与人)不知道博弈的支付 矩阵是哪个,假设 G1 和 G2 出现的概率各为12,并且这个概率为两个参与人的“共同知识”。

G1 L R G2 L R
U 1, 1 0, 0 U 0, 0 0, 0
D 0, 0 0, 0 D 0, 0 2, 2

(1) 将该博弈表示为一个贝叶斯博弈(列出参与人,类型,策略和支付); (2) 求出这个博弈的全部贝叶斯纳什均衡

参与人:参与人1(行参与人);参与人2(列参与人)

类型

  • 参与人1知道博弈的支付矩阵是G1还是G2。
  • 参与人2不知道博弈的支付矩阵是哪个。

策略

  • 参与人1的策略:U(上),D(下)
  • 参与人2的策略:L(左),R(右)

支付

G1 L R G2 L R
U 1, 1 0, 0 U 0, 0 0, 0
D 0, 0 0, 0 D 0, 0 2, 2

概率

  • G1和G2出现的概率各为 12
  • 这个概率为两个参与人的“共同知识”。

贝叶斯纳什均衡分析
步骤1:确定参与人的策略

  • 参与人1知道支付矩阵,因此他将根据支付矩阵选择策略。
  • 参与人2不知道支付矩阵,因此他将根据概率选择策略。

步骤2:计算参与人2的期望收益

  • 如果参与人2选择L,他的期望收益为:

    12×1+12×0=12

  • 如果参与人2选择R,他的期望收益为:

    12×0+12×2=1

步骤3:确定参与人2的最优策略

  • 参与人2将选择R,因为1 > 12

步骤4:确定参与人1的最优策略

  • 如果支付矩阵是G1,参与人1将选择U,因为1 > 0。
  • 如果支付矩阵是G2,参与人1将选择D,因为2 > 0。

贝叶斯纳什均衡

  • 如果支付矩阵是G1,参与人1选择U,参与人2选择R。
  • 如果支付矩阵是G2,参与人1选择D,参与人2选择R。

不完全信息博弈分析

参与人:i1,2
类型

  • 类型:tG1:12,G2:12

(纯)策略

  • 参与人1的策略:σ1UU,UD,DU,DD
  • 参与人2的策略:σ2L,R

支付

  • 支付:u~i(σ1,σ2),i1,2

支付矩阵

在给定先验概率为 12 时,两个参与人的支付矩阵可以表示为:

L R
UU 0.5, 0.5 0, 0
UD 0.5, 0.5 1, 1
DU 0, 0 0, 0
DD 0, 0 1, 1

纯策略贝叶斯纳什均衡

  • (UU,L)
  • (UD,R)
  • (DD,R)

混合策略贝叶斯纳什均衡

  • (UD:λ,DD:1λ),Rλ[0,1]
  • (UU:λ,UD:1λ),Lλ[12,1]

5 用逆向归纳法求解不完全信息动态博弈的完美贝叶斯纳什均衡

:设在 1 的第二个信息集上, 1 认为 2 选 a 的概率为 P,则 1 选 L 的支付 =5P+2(1P)=2+3P;1 选 R 的支付 =6P+3(1P)=3+3P>2+3P,故1必选 R
即得 给定 1 在第二个决策结上选 R,2 在左边决策结上会选 a, 故完美贝叶斯纳什均衡为{L,R,(a,d)}

6 双寡头古诺博弈
(Gibbons, 1992)考虑如下双寡头古诺模型。市场的反需求函数为P(Q)=AQ,其中Q=q1+q2为市场总产量,且需求是不确定的,分别以θ的概率为高(A=Ah),以1θ的概率为低(A=Al)。两厂商的成本函数为Ci(qi)=cqii={1,2}。并且信息也是不对称的:厂商1知道需求是高还是低,但是厂商2不知道。假设所有这些都是共同知识。两个厂商同时进行产量决策。(1)找出这两个厂商的策略集;(2)假设Ah,Al,θc的取值范围使得所有的均衡产出都为正数,求出此博弈的贝叶斯纳什均衡。
:(1)厂商1的策略空间为:{(q1h,q1l)|q1h,q1lR+},厂商2的策略空间为q2R+
(2)因为厂商1知道需求是高还是低,首先分别求出厂商1在面对不同市场需求时的最优反应:
A=Ah时,max(Ahq1hq2c)q1h,由一阶条件推出q1h=Ahq2c2
A=Al时,max(Alq1lq2c)q1l,由一阶条件推出q1l=Alq2c2
因为厂商2不知道需求是高还是低,它要最大化其期望利润,得

maxθ(Ahq1hq2c)q2+(1θ)(Alq1lq2c)q2

由一阶条件推出

q2=θ(Ahq1h)+(1θ)(Alq1l)c2

联立两个厂商的最优反应解得这个博弈的贝叶斯纳什均衡为((q1h,q1l,q2),其中

q˙1h=(3θ)Ah(1θ)Al2c6q1l=(2+θ)AlθAh2c6,q2=θAh+(1θ)Alc3.

7 (Gibbons, 1992) 对下面的扩展式博弈,写出其策略式博弈,并且找出所有的纯策略纳什均衡和子博弈贝叶斯纳什均衡,以及完美贝叶斯均衡。

解:(1) 此博弈的策略形式为:

L' R'
L 4,1 0,0
M 3,0 0,1
R 2,2 2,2
  • 纯策略纳什均衡为:(L,L), (R,R)
  • 子博弈完美纳什均衡为:{(L,L),p=1}{(R,R),p12}

(2) 此博弈的策略形式为:

L' M' R'
L 1,3 1,2 4,0
M 4,0 0,2 3,3
R 2,4 2,4 2,4
  • 纯策略纳什均衡为:(R,M)
  • 子博弈完美纳什均衡为:{(R,M),p[13,23]}

8 性别博弈
我们用之前讨论的“性别之争”来说明上述结论。我们已经知道该博弈有两个纯策略纳什均衡(歌剧,歌剧)和(足球,足球),以及一个混合策略纳什均衡:妻子以3/4和1/4的概率分布在歌剧和足球中随机选择,丈夫以1/3和2/3的概率分布在歌剧和足球之间随机选择。
我们首先构造“性别之争”博弈不完全信息条件下的“近似博弈”。假设夫妻俩虽然已经共同生活了相当长时间,但他们对对方关于歌剧表演、足球赛的偏好并没有彻底了解如果两人都去看歌剧,妻子的得益2+tw只有妻子自己完全清楚,丈夫对tw的实际数值并不知道,只知道均匀分布于[0,x]区间,丈夫陪妻子去看歌剧表演时的得益为1也是两人都完全清楚的,如果两人同去看足球赛赛,那么丈夫的得益为3+th,其中th也只有丈夫自己完全清楚,妻子对th 的实际数值并不知道,只知道th均匀分布于[0,x]区间,妻子陪丈夫去看足球赛时的得益为1也是两人都清楚的。如果两人无法协调一致行动时,双方的得益也是两人都清楚的,双方的得益都仍然是0。

现在我们来构造该不完全信息条件下的性别之争博弈的一个纯策略贝叶斯纳什均衡。设丈夫和妻子采用如下的策略:当妻子的类型tw超过某个临界值w,即tw>w时,选择观看歌剧表演,否则选择观看足球赛;当丈夫的类型th超过某个临界值h时,选择观看足球赛,否则选择观看歌剧表演。由于twth都是[0,x] 上的均匀分布,所以在上述双方的策略下,妻子选择观看歌剧表演的概率为wx;丈夫选择观看歌剧表演的率为hx,选择观看足球赛的概率为1hx。下面我们来求解wh,使双方的上述策略组合构成一个贝叶斯纳什均衡。假定丈夫已经采用了上述临界值策略,则妻子选择观看歌剧表演和足球赛的期望得分别为:

hx(2+tω)xhx0=hx(2+tw)

xωx1+ωx0=xωx

同样,只有当选择观看歌剧表演的期望得益大或等于选择足球赛的期望得益时,妻子才会选择观看歌剧表演,由此可得 thx/ω4h=x/ω4

解联立方程组

{ω=xh3h=xω4

可得

ω=3±9+3x2=3+9+3x2h=6±29+3x3=6+29+3x3

当参数 ωh 满足上述关系时,上述策略构成贝叶斯纳什均衡。为的概此时,妻子选择歌剧表演的概率为:

xωx=1ωx=13+9+3x2x

丈夫选择足球赛的概率为:

xhx=1hx=16+29+3x3x

x0 ,即不完全信息接近消失或微不足道时,上述两概率分别倾向于 3/42/3 ,上纯策略贝叶斯均衡就收敛为一个完全信息博率的混合策略纳什均衡,这正是我们之前给出的完全信息“性别之争“博率的混合策略均衡的随机选择概率分布。也正是在 x0 这个意义上,海萨尼认为完全信息博率的混合策略均衡是不完全信息博率贝叶斯均衡的极限。

9 抓钱博弈
桌子上放1元钱,桌子的两边坐着两个参与人,如果两人同时去抓钱,每人罚款1元;如果只有一人去抓,抓的人得到那元钱;如果没有人去抓,谁也得不到什么。因此,每个博弈方的策略是决定抓还是不抓。得益矩阵如下图所示

这个博弈有两个纯策略纳什均衡(一个博弈方抓另一个博弈方不抓)和一个对称混合策略均衡:每个博弈方以12的概率选择抓。后者是一个均衡,因为,如果博弈方i不抓,他的利润是0;如果博弈方i去“抓”,他的期望利润是12(1)+12(1)=0。现在考虑同样的博弈但具有如下不完全信息;每个参与人有相同的得益结构,但如果他赢了的话知道,但另一个博弈方不知道。假定,博弈方自己利润是1+θi(而不是1)。这里θi 是博弈方的类型,博弈方i自己知道,但另一个博弈方不知道。假定θi在区间[ε,ε] 上均匀分布。
我们考虑下列策略选择:(1)博弈方1:如果θ1θ1 ,选择“抓”;如果θ1<θ1 ,选择“不抓”;(2)博弈方2:如果θ2θ2,选择“抓”;如果θ2θ2 ,选择“不抓”。给定博弈方j的策略,博弈方i选择抓(用1表示)的期望利润是

ui(1)=(1θj+ε2ε)(1)+(θj+ε2ε)(1+θi)

这里,(1θj+ε2ε) 是博弈方j抓的概率, (θj+ε2ε)是博弈方j不抓的概率。博弈方 i 选择不抓 (用 0 表示) 的利润是 ui(0)=0 。因此, θj 满足下列条件

(1θj+ε2ε)(1)+(θj+ε2ε)(1+θj)=0

或简化为

2θj+θjθi+εθi=0

因为博弈是对称的,在均衡情况下,θi=θj,上述条件意味着θ1=θ2=0。也就是说每一个博弈方i,均衡情况下的最优选择是:如果θi0,选择“抓”;如果θi<0,选择“不抓”。因为 θi0θi<0 的概率各为 1/2, 每一个博率方在选择自己的行动时都认为对方选择抓与不抓的概率各为 1/2,似乎他面对的是一个选择混合策略的对手,尽管每个博弈实际上选择的都是纯策略。当ε0时,上述贝叶斯均衡就收敛为一个完全信息博弈的混合策略纳什均衡。因此,海萨尼说完全信息博弈的混策略均衡是不完全信息博弈贝叶斯均衡的极限。

10 试给出下述信号博弈的纯战略均衡中的混同均衡和分离均衡。

: 有四种可能: 混同均衡 t1m1,t2m1tlm2,t2m2
分离均衡 t1m1,t2m2t1m2,t2m1
u(mi)为接受者看见mi时认为发送者是t1的概率。看见t1m1,t2m1,则 u(m1)=0.5, 非均衡路径上 u(m2)=[0,1]
当接收者看见 m1, 选 a1 的支付为

0.5×2+0.5×1=1.5

a2 的支付为 0.5×8+0.5×7=7.5>1.5
故选 a2
当接受者看见 m2, 选 a1 的支付为

u(m2)×1+(1u(m2))×5=54u(m2)

a2 的支付为

u(m2)×7+(1u(m2))×3=3+4u(m2)

t1m1, 接收者会选 a2, t1 得支付 10 , 要求 t1 不选 m2, 对 u(m2) 无要求, 因 t1 总会选 m1
t2m1, 接收者会选 a2,t2 得支付 3 , 要求 t2 不选 m2 是不可能的, 因 t2m2 是占优于选 m1 的, 故此混同均衡 t1m1,t2m1 不存在。
再看混同均衡 t1m2,t2m2.

u(m2)=0.5

当接收者看见 m2, 选 a1 的支付为

0.5×1+0.5×5=3

a2 的支付为

0.5×7+0.5×3=5>3

故接收者必选 a2
当接收者看见 m1 时, 选 a1 的支付为

u(m1)2+(1u(m1)1=1+u(m1)

a2 的支付为

u(m1)8+(1u(m1)7=7+u(m1)>1+u(m1)

故必选 a2
这样, 无论发送者发出 m1m2 信号, 接收者总选 a2 给定接收者总是选 a2
t1 会选 m1,t2 会选 m2 t1m2,t2m2 不是混同均衡。
看分离均衡 t1m1,t2m2

u(m1)=1,u(m2)=0

接收者看见 m1 时, 必选 a2;接收者看见 m2 时, 必选 a1
此时, t1m1,t2m2t1m1,t2m2 是一个分离均衡。
最后看分离均衡 t1m2,t2m1

u(m1)=0,u(m2)=1

接收者看见 m1 时, 必选 a2;接收者看见 m2 时, 必选 a2 给定接收者总选 a2

t1m1,t2m2 故 t1m2,t2m1 不是分离均衡。 

故只有一个纯战略子博弈完全分离均衡

t1m1t2m2

11 厂商进入的信号博弈
现市场上有一新厂商打算进入市场,而自然决定这个进入者 (后称 p1 ) 强弱 (θs,θw) ,同时在位厂商 (后称 p2) 不知进入厂商的类型是强 (θs) 还是弱 (θw) ,但是可以观察到进入厂商释放的信号是强 (S) 还是弱 (W) 。在位厂商可以根据信号决定打 ( F,fight),还是适应 ( A,accommodate),见下图:

思考: 进入厂商 p1 有哪些策略: SSWWSWWS。以 SS 为例,第一个 S 的意思是,当 p1θs 时,发出 S 信号;第二个 S 的意思是,当 p1θw时,发出 S 信号。
在位厂商 p2 有哪些策略: FFAAFAAF。以 FF 为例,第一个 F 的意思是,当 p2 接受到 S 信号时,作出 F 动作;第二个 F 的意思是,当 p2 接受到 W 信号时,作出 F 动作。

解:(1) 考虑 S1=SWp1θs 时释放 S 信号,p1θw 时释放 W 信号。这是“说实话”的情况,那么在贝叶斯信念中,

{μ(θsS)=1,μ(θwW)=1.

那么从博弈树可知, p2 的策略为: S2=AF
解释:

p1 类型为 θs ,释放 S 信号, p2 选择 A 的收益高;
p1 类型为 θw ,释放 W 信号, p2 选择 F 的收益高。

分析:由序贯理性可知,若 p1 知道 S2=AF ,则 p1 在自己类型为 θw 时,释放 S 信号。而 S2=AF ,则 p2 选择 A 策略,此时收益 Bp1S=2 反而高于 p2F 的收益 Bp1W=1 ,这样就不是一个完美贝叶斯纳什均衡 (Perfect Bayesian Nash Equilibrium, PBNE)。
**(2) **考虑 S1=WSp1θs 时释放 W 信号, p1θw 时释放 S 信号。这是“说谎话”的情况,那么在贝叶斯信念中,

{μ(θsS)=0,μ(θsW)=1.

那么从博弈树可知,p2 的策略为: S2=FA
解释:

p1 类型为 θs ,释放 W 信号, p2 选择 A 的收益高;
p1 类型为 θw ,释放 S 信号, p2 选择 F 的收益高。

分析:由序贯理性可知,若 p1 知道 S2=FA ,则 p1 在自己类型为 θw 时,释放 W 信号。而 S2=FA ,则 p2 选择 A 策略,此时收益 Bp1W=3 反而高于 p2F 的收益 Bp1S=0 。那么这样就不是 PBNE
**(3) **考虑 S1=SSp1θs 时释放 S 信号, p1θw 时释放 S 信号。在贝叶斯信念中,

{μ(θsS)=P,μ(θsW)= 任意值. 

只看左边的树。有: S2=AA
p2 中,选 A 的收益为 Bp2A=1 ,选 F 的收益为 Bp2F=0×P+2×(1P)=2(1P)
如果要让 Bp2F<Bp2A ,则 2(1P)<1 ,得到

P>1/2.

那么结论是,若 P>1/2,则 p2 的策略为 S2=AA
i)然而,也要考虑 p1 释放 W 的情况(虽然不会出现,也要讨论)
可以发现, p2A 的收益为 Bp2A=1 ,选 F 的收益为 Bp2F=0×μ(θsw)+2×(1μ(θsw))= 2(1μ(θsw))
因为 μ(θsw)>1/2 ,则 p2 选择 F 的收益为 Bp2F=2(1μ(θsw))<1,综上, S2=AA
但是! p1θw 时可以认为,反正 p1 出什么信号, p2 都会选择 A 行为。从博弈树上可以看到, p1 释放 W时,收益为 Bp1W=3p1 释放 S 时,收益为 Bp1S=2
那么, S1 有可能偏离到 S1=SW 去,所以 (SS,AA,P) 不是PBNE。
ii) 同样考虑 p1 释放 W 的情况。有: S2=AF
此时,选 F 的收益为 Bp2F=0×P+2×(1μ(θsw))=2(1μ(θsw))
根据 2(1μ(θsw))>1 , 得到 μ(θsw)<1/2 时, Bp2F>1
那么,如果 p1θs 释放 W 信号,有 Bp1S=3Bp1W=0 ,是一个下降趋势;
如果 p1θw 释放 W 信号,有 Bp1S=2Bp1W=1 ,也是一个下降趋势。
所以, p1 不能为 θs 时释放 W 信号,也不能为 θw 时释放 W 信号。
综上, (SS,AF,μ)PBNE ,但需满足 μ(θsw)1/2,μ(θss)=P
(4)考虑 S1=WWp1θs 时释放 W 信号, p1θw 时释放 W 信号。在贝叶斯信念中,

{μ(θsw)=P,μ(θss)= 任意值. 

只看右边的树。有: S2=AA
p2 中,选 A 的收益为 Bp2A=1 ,选 F 的收益为 Bp2F=0×P+2×(1P)=2(1P) ,如果要让 Bp2F<Bp2F ,则 2(1P)<1 , 得到

P>1/2

那么结论是,若 P>1/2,则 p2 的策略为 S2=AA
**i) **然而,也要考虑 p1 释放 S 的情况 (虽然不会出现,也要讨论)
可以发现, p2A 的收益为 Bp2A=1 ,选 F 的收益为 Bp2F=0×μ(θss)+2×(1μ(θss))= 2(1μ(θss))
因为 μ(θss)>1/2 ,则 p2 选择 F 的收益为 Bp2F=2(1μ(θss))<1,综上, S2=AA
但是! p1θs 时可以认为,反正 p1 出什么信号, p2 都会选择 A 行为。从博弈树上可以看到, p1 释放 W时,收益为 Bp1W=2p1 释放 S 时,收益为 Bp1S=3
那么, S1 有可能偏离到 S1=SW 去,所以 (SS,AA,P) 不是PBNE。
ii)同样考虑 p1 释放 S 的情况。有: S2=FA
此时,选 F 的收益为 Bp2F=0×P+2×(1μ(θsw))=2(1μ(θsw))
根据 2(1μ(θsw))>1 ,得到 μ(θsw)<1/2 时, Bp2F>1
那么,如果 p1θs 释放 S 信号,有 Bp1W=2Bp1S=1 ,是一个下降趋势;
如果 p1θw 释放 S 信号,有 Bp1W=3Bp1S=0 ,也是一个下降趋势。
所以, p1 不能为 θs 时释放 S 信号,也不能为 θw 时释放 S 信号。
综上, (WW,FA,μ)PBNE ,但需满足 μ(θss)1/2,μ(θsw)=P

12 信号博弈
(Gibbons, 1992)(1) 求出下面信号博弈的一个混同完美贝叶斯均衡,其中两类发送者都选信号 R 。

(1) 图 (2)图

(2) 下面的三类型信号博弈由自然的行动开始,没有在博弈树上表示出来,以同样的概率赋予发送者三种类型中的一种。求出一个混同完美贝叶斯均衡,其中三类发送者都选择信号 L 。
(3)求出(1)和(2)中其它的所有纯策略完美贝叶斯均衡。
:我们令发送者为参与人1,接收者为参与人2。
(1) {σ1(t1)=R,σ1(t2)=R,σ2(L)=u,σ2(R)=d,μ(t1L)13,μ(t1R)=12}.
(2) {σ1(t1)=σ1(t2)=σ1(t3)=L,σ2(L)=σ2(R)=u,μ(tiL)=13,μ(t3R)12}
(3)第(1)个信号博弈只有一个混同完美贝叶斯均衡,不存在其他纯策略完美贝叶斯均衡。第(2)个信号博弈还有一个(半)分离完美贝叶斯均衡,其中

σ1(t1)=L,σ1(t2)=L,σ1(t3)=R,σ2(L)=u,σ2(R)=d,μ(t1L)=μ(t2L)=12,μ(t3R)=1

13 考虑如下不完全信息动态博弈:自然首先选择博弈 G1 或者 G2,且选择 G1 的概率为 0.6。行参与人1,在观察到自然选择了哪个博弈之后,选择行动 A 或者 B。列参与人没有观察到自然的选择,但是他在观察到行参与人的行动之后,选择行动 A 或者 B。

G1 A B G2 A B
A 1,2 2,1 A 2,1 1,2
B 2,0 0,2 B 0,2 4,0

(1)请证明这个博弈不存在分离均衡。(提示:这里行参与人的私人信息就是他的类型。)
(2)求出这个博弈的一个混同均衡。
(3)如果行参与人没有观察到自然的选择,他是否能得到更高的收益?

解:(1)共有两种可能的分离均衡
第一种是行参与人在 G1 时选择 A 在 G2 时选择 B 。这时列参与人将会根据行参与人的行动推断出博弈是 G1 还是 G2,故列参与人的最优反应是选择 A 不论行参与人选择了哪个行动,但是在给定列参与人的选择 A 之后,行参与人将在 G1 时从 A 偏离到 B,因此这种情况不是分离均衡。
第二种是行参与人在 G1 时选择 B 在 G2 时选择 A。同样的逻辑,这时列参与人的最优反应是选择 B 不论行参与人选择了哪个行动,但行参与人将会有动力在 G2 时从 B 偏离到 A,因此这种情况也不是分离均衡。
(2)共有两种可能的混同均衡
一种情况是行参与人在两个博弈都选择 B,此时列参与人的最优反应是 B,但行参与人将有动力在 G1 时偏离到 A,因此这种情况不是分离均衡。另一种情况是行参与人在两个博弈都选择 A,此时列参与人的最优反应是 A。行参与人在 G1 时的收益为 1,在 G2 时的收益为 2。为使行参与人没有激励偏离到 B,列参与人需要在观察到 B 时选择混合策略 (12,12),故列参与人的信念为:

μ(G1|B)=μ(G2|B)=0.5

(3)博弈的期望支付矩阵为:

A B
A 1.4,1.6 1.6,1.4
B 1.2,0.8 1.6,1.2

当行参与人没有观察到自然的选择时,这个博弈的子博弈完美纳什均衡为:行参与人选择 B,列参与人观察到 A 时选择 A,观察到 B 时选择 B。故行参与人的均衡收益为 1.6,比第(2)问均衡中的收益高。直觉上讲,当行参与人观察到自然的选择时,他不能“可靠地”在 G1 时选择 B,从而列参与人在观察到 B 时将不会选择 B。

14 两个人合作开发一项产品。
能否成功与两个人的工作态度有关, 设成功概率如下:

再假设成功时每人有 4 单位的利益, 失败则双方都没有利益, 偷懒本身有 1 单位的利益。问该博弈无限次重复博弈的均衡是什么?
:两个人的收益矩阵如下:

一次博弈纳什均衡为 (偷懒, 偷懒), 无法实现帕累托最优 (努力, 努力)。无限次博弈时, 对于A, 第一阶段选择努力,
(1) 若前 1 时刻选择均为努力, t 时刻也选择努力

πA=limt94(1+δ+δ2++δt)=94(1δ)

(2) t 时刻选择偷懒, 则前面的行为均为偷懒

πA=52+limt2(δ+δ2++δt)=52+δ4δ

达到 (努力, 努力) 这个均衡, 使 πA>πA, 即 δ>12, 采取触发策略,均衡为(努力,努力),合作产生。

15 市场进入博弈
一个完全垄断企业B正在垄断一个行业市场,另一个潜在的试图进入该行业的企业A,称A为进入者,B为在位者。A不知道B的成本特征,设B有两种可能的成本,即高成本和低成本。两种成本情况下的博弈矩阵如下图。假定B知道进入者A的成本为高成本,且与B为高成本时的成本相同,求其贝叶斯纳什均衡。

:若信息是完全的,则当B为高成本时,唯一的精炼纳什均衡为(进入,默认),另一纳什均衡(不进入,斗争)是含有不可置信的威胁。当B为低成本时,唯一的纳什均衡为(不进入,斗争),即若A进入行业,具有低成本优势的B将通过降低价格将A逐出市场。由于存在行业进入成本,所以A被逐出市场后将有净的10单位进入成本的损失。当A不知道B的成本情况时,他的选择将依赖于他对B的成本类型的主观概率或先验概率密度。
设A对B是高成本的先验概率判断为p,则A认为B为低成本的概率为1p
如果A进入,其期望支付为p(40)+(1p)(10);如果A不进入,其期望支付为0。
当且仅当p(40)+(1p)(10)0p15 时,A选择进入;反之,当p<15时,A不进入。
于是,贝叶斯均衡为:(进入,默认),高成本,p>15; (进入,斗争),低成本,p<15 ;不进入,),p=15,其中表示可以是斗争,也可以是默认。

16 成本为私有信息的双寡头古诺博弈
两个厂商生产相同产品在市场上进行竞争性销售。第1个厂商的成本函数为c1=q1 ,其中q1 为厂商1的产量。第2个厂商的成本函数为c2=cq2 ,其中q2厂商2的产量,c为其常数边际成本。两个厂商的固定成本都为零。厂商2的边际成本c是厂商2的“私人信息”,厂商 1 认为 c[12,32 上呈均匀分布。设市场需求函数为 P=4q1q2, 其中 P 为价格, 两个厂商都以其产量为纯战略, 问纯策略贝叶斯均衡为何?
: 给定 q2, 厂商 1 的问题是

maxq1π1=(P1)q1=(4q1q21)q1

q2=q2(c) 。广商 1 不知道 c,故目标函数为

maxq1123/2(4q1q2(c)1)q1dc=maxq1[3q1q12q1123/2q2(c)dc]

一阶条件:

32q1123/2q2(c)dc=0

q1=3212123/2q2(c)dc(1)
厂商 2 的问题是:

maxq2π2=(Pc)q2=(4q1q2c)q2=(4c)q2q1q2q22

一阶条件:

(4c)q12q2=0

q2(c)=4cq12(2)

代入式 (1):

q1=3212123/24cq12dc=3212123/24q12+14123/2cdc=324q14+18[(32)2(12)2]=3+q14

q1=1
代入式 (2):

q2(c)=3c2

c=1, 则 q1=q2=1

π1=π2=1

若信息是完全的且 c=1, 则古诺博弈均衡为 q1=q2=35<1,π1=π2=2725>1

17 下图博弈是一个不完全信息动态博弈,在位者和进入者之间的竞争决策。假设市场中存在者的成本有两种可能性:高成本(概率为μ)和低成本(概率为1−μ)。在位者会根据成本情况设置不同的价格 P=4,5,6 来影响潜在进入者的决策。试给出其分离均衡和混同均衡。

解: 混同均衡
在位者的策略

  • 高成本和低成本的存在者选择相同的价格P,使得进入者无法根据价格推断存在者的成本。例如,高成本和低成本存在者都选择P=5

进入者的策略

  • 进入者在观察到价格P之后,基于信念(即存在者是高成本或低成本的概率分布),决定是否进入市场。由于存在者采取相同的策略,进入者不能确定存在者的成本,因此会混合地选择进入与否。

混同均衡下的信念更新

  • 如果进入者看到P=5,他无法判断存在者的成本类型,因此基于贝叶斯更新规则,进入者可能会假设两种成本的概率都是12或根据先验概率μ1μ来更新信念)。

分离均衡

存在者的策略

  • 高成本和低成本的存在者选择不同的价格。比如,高成本的存在者选择P=6,而低成本的存在者选择P=4。通过这种价格选择,进入者可以通过观察到的价格来推断存在者的成本类型。

进入者的策略

  • 进入者观察到价格后,可以准确地判断存在者的成本类型。如果看到P=6,他会知道存在者是高成本类型;如果看到P=4,他会推测存在者是低成本类型。

信念更新

  • 进入者根据价格直接更新自己的信念为确定的值(即高成本对应特定价格,低成本对应另一特定价格),从而做出相应的进入或不进入决策。

18 如下图,求不完全信息扩展式博弈的所有混同均衡(pooiing)和分离均衡(separating)。

18题图(1) 18题图(2)

解:(1)玩家1有两种分离策略
w类别选择R,s类别选择L。信息集的概率为1,基于观察玩家1选择的条件。观察L后,玩家2认为玩家1是s类别,观察R后,玩家2认为玩家1是w类型。因此,在左侧信息集中,玩家2选择d,在右侧信息集中,玩家2选择u。给定玩家2的最优行动,玩家1的每种类型都没有有利可图偏差:对于w型,偏差产生1,无偏差产生5;对于s型,偏差产生2,无偏差产生4。
w类别选择L,s类别选择R。信息集的概率为1,基于观察玩家1选择的条件。观察L后,玩家2认为玩家1是w类型,观察R后,玩家2认为玩家1是s类型。因此,在左侧信息集中,参与人2选择u,在右侧信息集中,玩家2选择d。给定玩家2的最优行动,玩家1的每种类型的都没有有利可图偏差:对于w型,偏差产生2,无偏差产生3,对于s类型,偏差产生2,无偏差产生3。
(2)玩家1有两种分离策略
w类别选择R,s类别选择L。信息集的概率为1,基于观察玩家1选择的条件。观察R后,玩家2认为玩家1是s类别。因此,玩家2选择u,给定玩家2的最优行动,每种类型的玩家1都没有盈利偏差。
w类别选择L,s类别选择R。信息集的概率为1,基于观察玩家1选择的条件。观察R后,玩家2认为玩家1是s类别。因此,玩家2选择d。给定玩家2的最优行动,每种类型的玩家1都没有盈利偏差。
接下来讨论混同策略
无论类别,都选R。信息集的概率为1,基于观察玩家1选择的条件。观察R后,玩家2认为玩家1有0.5的概率为w类别,有0.5的概率为s类别。玩家2从U得期望效用是0.5×(1-1)=0,从D得期望效用是0.5 ×(0+2)=1。因此玩家2选D。假设玩家2选D,w类别的玩家1有动机倾向于选择L,因为L的收益是2,而R的收益是1。因此不存在这样的完美贝叶斯均衡。
无论类别,都选L。信息集的概率为1,不再基于观察玩家1选择的条件。玩家2可以选择任何信念。对于玩家2的任何信念,如果玩家2选择U,那么s类别的玩家1就有偏离的动机。如果玩家2选择D,那么s类别玩家1就有偏离的动机。因此不存在这样的完美贝叶斯均衡。这里不考虑混合策略。

博弈论07:不完全信息扩展式博弈

posted @   郝hai  阅读(2439)  评论(0编辑  收藏  举报
相关博文:
阅读排行:
· 全程不用写代码,我用AI程序员写了一个飞机大战
· DeepSeek 开源周回顾「GitHub 热点速览」
· 记一次.NET内存居高不下排查解决与启示
· 物流快递公司核心技术能力-地址解析分单基础技术分享
· .NET 10首个预览版发布:重大改进与新特性概览!
点击右上角即可分享
微信分享提示