《数学模型》 第10章 博弈模型
《数学模型》第10章 博弈模型
10.1点球大战
博弈分为合作博弈和非合作博弈
根据所有决策者的决策是同时做出的、还是按一定先后顺序作出的,非合作博弈可以分为静态博弈和动态博弈
根据决策者在决策时所掌握的信息多少,非合作博弈可以分为完全信息博弈和不完全信息博弈
完全信息的静态博弈:参与人(player)、策略空间(决策变量的取值范围)、效用函数(决策的目标函数)
零和博弈和常数和博弈
支付矩阵(payoff matrix,也译为收益矩阵、赢得矩阵)
\[M=(m_{ij})_{2\times 2}=\left(\begin{matrix}0.58&0.95\\0.93&0.70\end{matrix}\right)
\]
纯策略Nash均衡(Nash equilibrium):如果对方不改变策略,每一方的策略选择都是最优的.
\[u_1(a_1^*,a_2^*)\geqslant u_1(a_1,a_2^*),u_2(a_1^*,a_2^*)\geqslant u_2(a_1^*,a_2),a_1\in\{1,2\},a_2\in\{1,2\}
\]
混合策略Nash均衡
\[\]