博弈论是一种数学思想而不是一种方法。

关于分布式系统中每个博弈者如何采取策略使自己的受益最大化,但并不是指整个系统道额受益最大化。

注意前提,每个博弈者都是理智自私的。即只要是对自己有利的不论是否会对别人造成伤害都会采取行动。

博弈的三要素:博弈者、策略、收益。策略有离散的和连续的。

更关注稳定下的博弈论,其中Nash均衡是我们追求的稳定点,但不一定是收益最大点。

如何求解一个博弈:重复保留(或剔除)严格优策略(或严格劣策略)。

严格优策略是指,对一个博弈中的一个博弈者,若其采用的一个策略S1所获得的受益比采取策略S2时所获得收益严格大(没有等于号),并且对其他博弈者所采用的任何策略都成立,此时称S1相对S2为严格优策略。严格劣策略则与之相反。

使用重复剔除一些理性自私的博弈者不会选择的策略(严格劣策略),可以初步得到一个博弈的解。但是这种方法并不总是有用,如在古诺模型中并不起作用。

我们在求解一个博弈时目标是找到一个Nash均衡点,且如果博弈论可以为一个博弈提供一个唯一解,则此解一定是Nash均衡。

Nash均衡:在一个n博弈者的博弈中,对某个策略组合,其中的任何一个博弈者所采用的策略都是对其他n-1博弈者所采用策略的最优(大于等于)反应,在这种情况下,任何一个博弈者都不会变动自己的策略,此时达到Nash均衡。

Nash均衡点是比重复严格优或劣策略更强的概念。如果一个策略组合是一个Nash均衡,则其一定不会被重复剔除严格劣策略剔除,经过重复剔除严格劣策略保留的策略组合可能和Nash均衡一点关系都没有。

Nash已经证明在任何一个有限博弈中,都存在至少一个均衡。

一个博弈中Nash均衡点可能并不是唯一的。

举若干个栗子:

囚徒困境

性别之战

古诺双寡头垄断模型