「博弈论」耶鲁大学公开课笔记
入门结论#
1.不要选择严格劣势策略(不管对方选择什么,你的选择都比另一个选择更劣)
2.理性选择导致次优结果
3.汝欲得之,必先知之(知道你的目的
4.学会换位思考对手
5.耶鲁大学学生都是自私鬼(娱乐向
经典案例:囚徒困境
如上选择及打分条件(每个位置前一个数字是得分,后一个是得分),那么和的最优策略应该选,因为无论对方选什么,选都比选收益更大
得出了结论:不要选择严格劣势策略
大家都选每人都能得到分,但因为心理黑暗等原因理性的人们趋向于选,所以结论:理性选择导致次优结果
若你是,由于情绪、喜好等因素,你眼中的得分变成了如下情况
此时你要做出选择的话,要先知道自己的选择在考虑了各种因素后的最终收益(表2),而不是开始时给出的表面收益(表1)
结论:汝欲得之,必先知之
若你的对手没有心,它的表仍然是,而你是善良美少女,你的表已经变成了,那么在你的对手眼中,评分表如下:
此时你的对手一定会选择
在你的眼中,评分表如下:
由于你知道你的对手没有心,必定会选择,那么为了让自己收益更高,你也应该选择,结论:学会换位思考对手
博弈要素#
参与人(表述法)、策略,策略集合,某一次博弈,策略组合(某次博弈中所有人的策略)、收益
除了之外所有人的策略
严格优势策略:对所有成立
弱优势:对所有成立,对至少一个成立
共同知识#
数字游戏:在中选择一个数字写下,最接近所有人写下数字的平均数的的人可以获得奖励
那么在任何情况下,以上的数字都不应该被选择,因为他们是严格劣势策略
如果你是理性的,而且你知道和你同台竞技的人都是理性的,那么以上的数字已经出局了,现在再审视这个游戏,以上的数字同样不应该被选择
在进行迭代剔除后,最后理性人之间的游戏应该都选择
在这个游戏中,剔除以上数字的前提是,你知道以上的数字不应该选,你知道你的同伴是理性的他们不会选以上的数字,你的同伴知道你是理性的不会选以上的数字,你知道你的同伴知道你是理性的……
我们称这种相互知道的事情为共同知识
注意以下情况:
给两个人分别戴上一顶粉色帽子,每个人能看见对方帽子颜色但不能看见自己的,那么,游戏中至少有一顶粉色帽子是共同知识吗?
实际上不是
因为比如知道是粉色帽子,他知道游戏中至少有一顶粉色帽子这个事实,但是他也许会认为自己是一顶蓝帽子,他会认为因为只能看到自己的蓝帽子而不认为游戏中至少有一顶粉色帽子,所以知道而不能确定知道的事情不是共同知识
迭代剔除与中位选民定理#
有两个候选人与十种立场,每个立场有支持,每个立场的支持者会支持与他们立场最相近的候选人,候选人如何选择立场使得自己获得的选票更多?
容易发现立场相比与立场来说,是一个弱优势策略,相比之下我们是不会选择立场的(立场同理)
在剔除了立场的选择之后,我们发现立场相较立场又是一个弱优势策略,我们同样不会选择立场
要注意的是这个假设是建立在立场已经排除的情况下,否则若立场未被排除,在对手选择立场的情况下立场要优于立场,也就是要确保立场是劣势策略是共同知识
在迭代剔除后,我们的选择只剩下了立场和
这是中位选民定理,越中立的候选人越能获得大多数支持
现实中影响因素很多,不完全符合模型
但并不意味着模型是无意义的,我们可以通过添加因素看看模型预测结果的变化,来理解因素对结果的影响是如何体现的
最佳对策#
参与人的策略是对手的策略的最佳对策()
对参与人的所有都适用
或
参与人的策略是对对手的可能采取的策略时的最佳对策()
对参与人的所有都适用
或
不要选择非最佳对策的策略
例如:
函数
可以发现在对手的任何策略下,都不是最佳对策,所以应该被排除
纳什均衡#
假设一家公司利润两人平分,每个人可以选择为公司贡献的工作时间(注意此处的策略是连续的,可以选择到间的任何数字)
公司总收益为
若无项,合作将无意义
收益:,成本
由于决策连续,我们不能对每个决策列出一条曲线
求导
为了确定它是最大值还是最小值需要求二阶导
说明上述是最大值
解出一阶导
同理
假设此时
对二者列出函数
根据不要选非最佳对策,任何人都不会选择小于和大于的部分
所以我们的视线缩小到1*1范围的框内
在迭代剔除后,最终的最佳对策是两函数交点
即
交点被称作纳什均衡点
任何人都不愿意偏离纳什均衡点
在偏离纳什均衡点的过程中,比如上述合作,偏离的越远,那么玩家的边际效应递减
有时结果会趋近纳什均衡点
如我们多次玩猜数字游戏,在不提及纳什均衡点的前提下,结果会不断趋近
正式定义:
纳什均衡:
一个策略集合对于任意参与其中的玩家所选择的策略是其他参与人所选策略的最佳对策
实施纳什均衡的动机(听不懂)
不后悔
纳什均衡可以被想象成自我实施的信念(几个人都认为事情会向纳什均衡发展,那么事情就一定会向纳什均衡发展)
找纳什均衡点:
那么是纳什均衡点,因为在这一点,两个玩家都选择了最佳对策
严格劣势策略不会出现在纳什均衡里,弱劣势策略不一定
投资博弈#
先猜后证:人数很多 策略不多
预测:如果一开始投资概率超过阈值,那么博弈将会趋近于较优的纳什均衡,如果一开始低于阈值,那么博弈将会趋近于较劣的纳什均衡
但较劣的纳什均衡和囚徒困境不同,因为这里 没有严格劣势策略
协调博弈,如果协调成功就到了较优的纳什均衡没有人会反悔,但经常有协调谬误
银行挤兑:
银行有两种纳什均衡,较优均衡是大家对银行有信心而存钱
较劣均衡是人们对银行失去信心疯狂提款
协同谬误不同,仅凭沟通而非合同就可以改善结果
交流可以改变纳什均衡,约束才能改变囚徒困境
这和领导力紧密联系,协调博弈是领导力的用武之地
在投资中别人越投资你就越想投资
这种别人付出越多你就付出越多的博弈叫做策略互补博弈
性别大战#
选电影是严格劣势策略
而两人都看或电影都是纳什均衡
这是一个每参与者爱好不同的纳什均衡,这很容易导致协调失败
古诺双寡头模型#
前提:学习过怎么在参与者较少且策略不多的博弈中找到纳什均衡
这个博弈介于经济学导论的两种极端情况之间:完全竞争和垄断
研究市场如何发展 对消费者有利还是生产者有利
策略:同质商品的产量,连续,用来表示策略
生产成本,边际成本是常数
市场价格
利润
当的生产数量确定时我们要找出的最佳产量
求导后令导数等于零之类的
边际收入等于边际成本的那点是垄断产量
根据纳什均衡定义大力找函数交点
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· 如何编写易于单元测试的代码
· 10年+ .NET Coder 心语,封装的思维:从隐藏、稳定开始理解其本质意义
· .NET Core 中如何实现缓存的预热?
· 从 HTTP 原因短语缺失研究 HTTP/2 和 HTTP/3 的设计差异
· AI与.NET技术实操系列:向量存储与相似性搜索在 .NET 中的实现
· 地球OL攻略 —— 某应届生求职总结
· 周边上新:园子的第一款马克杯温暖上架
· Open-Sora 2.0 重磅开源!
· 提示词工程——AI应用必不可少的技术
· .NET周刊【3月第1期 2025-03-02】