博弈概念
博弈论将多人决策场景描述为博弈,每个玩家在预测其他玩家的理性行为的同时,选择能够给自己带来最大可能回报的行动。玩家是游戏的基本实体,他们做出决定并执行行动。游戏是对战略互动的精确描述,包括玩家可以采取的行动的限制条件和回报,但没有说明他们实际采取的行动。解决方案概念是通过使用可能的最佳策略和可能的结果来系统地描述游戏将如何进行。如果该方案指定了一种情况(状态)下所有可能行动的概率分布,那么该策略就被称为混合策略(mix strategy)。
Game theory describes multi-person decision scenarios as games where each player chooses actions which result in the best possible rewards for self, while anticipating the rational actions from other players.
纳什均衡
任何单方面偏离纳什均衡所表述的策略轮廓的行为对其偏离者没有任何好处。
This means that any unilateral deviation from the strategy profile stated by the Nash equilibrium has no profit for its deviator.
零和博弈
零和博弈(zero-sum game)是双方一旦发生博弈,一方胜利赢得了收益,那么另一方就会吃亏,然而双方的收益和亏损相加在一起总和永远都为零。这样无法实现集体和个人利益的最大化,整个社会的利益也并不会因此而增加。
非零和博弈
非零和博弈(general-sum game)是一种合作下的博弈,博弈中各方的收益或损失的总和不是零值,它区别于零和博弈。在经济学研究中比较有用。 在这种状况时,自己的所得并不与他人的损失的大小相等,连自己的幸福也未必建立在他人的痛苦之上,即使伤害他人也可能“损人不利己”,所以博弈双方存在 “双赢”的可能,进而达成合作。
随机博弈
在博弈论中,随机博弈(stochastic games)是一类由一个或多个参与者进行的、具有状态概率转移的动态博弈,是由劳埃德·夏普利(Lloyd Shapley)于20世纪50年代初期提出。
随机博弈由一系列阶段组成。在博弈中每一阶段的起始,博弈处于某种特定状态。每一参与者选择某种行动,然后会获得取决于当前状态和所选择行动的收益。之后,博弈发展到下一阶段,处于一个新的随机状态,这一随机状态的分布取决于先前状态和各位参与者选择的行动。在新状态中重复上述过程,然后博弈继续进行有限或无限个数的阶段。一个参与者得到的总收益常用各阶段收益的贴现和,或是各阶段收益平均值的下限来计算。
但遇到的发展瓶颈是包含2个以上的参与者的随机博弈是否存在纳什均衡,仍然是个未决的问题。