混合战略是指博弈的参与者以一定的概率去选择某种战略。这类博弈虽然在一次操作中有输有赢,但将这个博弈多次重复进行,可以研究各个战略应赋予多大的概率,能获得最大的期望(平均)收益。

一、混合策略

混合策略博弈和混合策略纳什均衡

分析猜硬币博弈。盖硬币一方必须:1、保证自己的策略选择不能被猜硬币一方预先知道;2、如果博弈多次进行,那么盖硬币一方的策略必须是无规律的。3、正面和反面的概率必须是0.5。对于猜硬币方也是如此。

猜硬币游戏中,两个参与人的最佳策略都是以0.5的概率选择正面,0.5的概率选择反面。这种参与人以一定的概率分布在可选策略中随机选择的决策方式称为"混合博弈"(mixed strategies),相应的前面分析中参与人只选择特定的策略的博弈称为"纯策略"

   

例:猜硬币博弈,双方都以0.5的概率选择正面和反面时的期望效用函数:

猜硬币方1:u1(0.5,0.5)=0.5*[1*0.5+(-1*0.5)]+0.5*[(-1*0.5+1*0.5]

   

给定对方的混合策略,参与人的最优混合策略是使其期望效用函数最大化的混合策略。所有参与人的最优混合策略的组合即混合策略纳什均衡。

定义混合策略纳什均衡:在n个参与人的博弈G={S1,...Sn;u1,...un}中,混合策略组合构成一个纳什均衡,如果对于所有的i=1,2...,n下式成立:

   

也就是说,如果一个策略组合使任何一个参与人的策略都是相对于其他参与人的策略的最佳策略,这个策略就构成一个纳什均衡,不管这个策略是混合策略还是纯策略

   

解混合策略纳什均衡的方法

1、最大化支付法:即最大化各个参与人的效用函数。

2、支付相等法:根据前面分析的猜硬币博弈中参与人的策略的思路,每个参与人的混合策略都使其余参与人的任何纯策略的期望支付相等,因此,解混合策略纳什均衡可以令参与人的各个纯策略支付相等,构成方程组求解。

   

二、社会福利博弈

解法1、最大化期望效用函数法:

假定政府的混合策略是,流浪汉的混合策略是:。

政府的期望效用函数为:

求导得最优化一阶条件:

   

同理,最大化流浪汉效用函数得政府救济的概率是:

   

   

解法二:期望支付相等法

假设流浪汉的混合策略为(r,1-r),政府选择纯策略救济的期望支付是:

   

选择纯策略不救济的期望支付是:

   

4r-1=-r r*=0.2

同理可得政府救济的概率为:

   

三、多重均衡博弈与混合策略

一、性别战

期望支付相等法:

妻子的混合策略(w,1-w)应该使丈夫看足球与时装表演的期望支付相同:

w*1+(1-w)*0=w*0+(1-w)*3

w=0.25

丈夫的混合策略应使妻子的期望支付相等:

h*2+(1-h)*0=h*0+(1-h)*1

h*=1/3

在混合策略纳什均衡((1/3,2/3),(0.75,0.25))下,妻子的期望支付是:

w*[h*2+(1-h)*0]+(1-w)[h*0+(1-h)*1]=0.67

丈夫的期望支付是:

h[w*1+(1-w)*0]+(1-h)[ w*0+(1-w)*3]=0.75

都小于双方协商沟通时得到的支付。

posted on 2010-03-23 19:39  sprite_bx  阅读(8968)  评论(0编辑  收藏  举报