读书笔记: 博弈论导论 - 03 - 完整信息的静态博弈 预备知识
读书笔记: 博弈论导论 - 03 - 完整信息的静态博弈 预备知识
预备知识
本文是Game Theory An Introduction (by Steven Tadelis) 的学习笔记。
知识点
-
静态完全信息博弈(static games of complete information)
第一步:每个玩家同时并且独立的选择一个行动,(每个玩家都不知道别人的选择情况)
第二步:根据所有玩家选择的行动,收益被分布到每个玩家。 -
完全信息博弈(Games of Complete Information)
一个完全信息博弈要求:下面四部分是博弈中所有玩家的公共知识。- 所有玩家的所有可能的行动
- 所有可能的结果
- 所有玩家的各种行动组合产生什么样的结果
- 每个玩家对结果的倾向
-
公共知识(common knowledge)
一个公共知识是一个事件E,并且 (1) 每个人都知道, (2) 每个人都知道每个人都知道,像这样无限循环下去。
普通形式博弈
-
普通形式博弈(normal-form game)有下面三个特征:
- 一组玩家
- 每个玩家有一套行动
- 一套收益函数:每个玩家的行动组合都有一个收益值。
-
策略(strategy)
打算完成一个特定目标的行动计划。 -
纯策略(pure strategy)
玩家i的一个纯策略是一个确定性的(意味着没有随机性)行动计划。
\(S_i\)用来表示玩家i的所有纯策略。 -
所有玩家的纯策略组合(a profile of pure strategies)
\(s = (s_i, s_2, \cdots, s_n), s_i \in S_i \text{ for all } i = 1,2,\cdots, n\)
代表在一个博弈中所有n的玩家的一组选择的纯策略组合。 -
普通形式博弈(normal-form game)的数学表达
- 一个有限的玩家集合, \(N = {1, 2, \cdots, n}\)
- 每个玩家的纯策略集合的组合, \({S_1, S_2, \cdots, S_n}\)
- 一套收益函数, \({v_1, v_2, \cdots, v_n}\),对于每个玩家,每一种所有玩家选择的策略组合,都有一个收益值。
$v_i: S_1 \times S_2 \times \cdots \times S_n \text{ for each } i \in N $
-
普通形式博弈(normal-form game)的数学表达例子:囚徒困境(The Prisoner's Dilemma)
Players:\(N = {1,2}\)
Strategy sets: \(S_i = {M, F} \ for \ i \in N\)
Payoffs: Let \(v_i(s_1, s_2)\) be the payoff to player i if player 1 choose \(s_1\) and player 2 chooses \(s_2\)
We can then write payoff are
\(v_1(M, M) = v_2(M, M) = -2\)
\(v_1(F, F) = v_2(F, F) = -4\)
\(v_1(F, M) = v_2(F, M) = -5\)
\(v_1(M, F) = v_2(M, F) = -1\)
M: mum 沉默; F:fink 告密
2人有限博弈的矩阵表达
- 例子:囚徒困境(The Prisoner's Dilemma)
Player 2 | |||
---|---|---|---|
M | F | ||
Player 1 | M | -2, -2 | -5, -1 |
F | -1, -5 | -4, -4 |
方案设想(solution concept)
-
方案设想(solution concept)
方案设想(solution concept)是一个分析博弈的方法,用于限定出所有可能的合理结果。
一个方案设想将导致一个预言或者处方。 -
均衡(equilibrium)
任何一种可以产生方案设想预言的策略组合。
也就是可以任何一种导致合理结果的策略组合。
如果用因果关系来说明,均衡是(可以导致合理结果的)因,方案设想是(可以导致合理结果的)分析方法,因果关系的公共知识。
从权衡方面来说:方案设想就是一个权衡。均衡的权衡的结果。
-
方案设想的假设条件
- 玩家是理性的
- 玩家是智力的
- 公共知识:“玩家是理性的”和“玩家是智力的”是所有玩家的公共知识。
- 自我执行:方案设想的均衡必须是自我执行的。(每个玩家都会采用一种均衡结果)
-
方案设想的评估
- 存在性(Existence: How often does it apply?)
- 唯一性(Uniqueness: How much does it restrict behavior?)
- 不变性(Invariance: How sensitive is it to small changes?)
-
帕累托优势(pareto dominate)
策略组合s帕累托优势于策略组合s',其前提条件:对于每个玩家,在策略组合s中的收益都大于等于在策略组合s‘中的收益,并且至少有一个玩家,在策略组合s中的收益大于在策略组合s‘中的收益。
参照
- Game Theory An Introduction (by Steven Tadelis)
请“推荐”本文!