读书笔记: 博弈论导论 - 17 - 不完整信息的动态博弈 建立信誉

读书笔记: 博弈论导论 - 17 - 不完整信息的动态博弈 建立信誉

建立信誉(Building a Reputation)

本文是Game Theory An Introduction (by Steven Tadelis) 的学习笔记。

为什么我们要建立良好的信誉?为什么我们更愿意和有信誉的人交往?
本章从囚徒困境这个问题,证明了即使在2阶段的囚徒困境中,如果一方有可能选择合作(也就是沉默),另一个方在第一阶段也有可能选择合作。
让我们回忆一下囚徒困境。
囚徒困境的均衡是双方都告密。
在有限多阶段的囚徒困境中的均衡仍然是双方都告密。
在无限多阶段的囚徒困境中的均衡是双方合作沉默。

本章给出了一个囚徒困境的例子,在这个例子中,存在一个不完整信息,就是玩家1有两种类型:

  1. 标准策略类型; 2) grim-trigger 策略类型。
    这个grim-trigger 策略是:在第一个阶段博弈中,选择合作(C),在一个t > 1阶段中,选择合作(C)仅仅当玩家2在上一个阶段中选择合作(c)。
    p>0为自然选择玩家1是grim-trigger 策略类型的可能性。
Player 2
c d
player 1 C 1, 1 -1, 2
D 2, -1 0, 0

玩家2使用标准策略,因此在第2阶段会选择叛变(defect)。
但是在第1阶段中选择合作和叛变,其收益分别为:

(1)choose c in period 1v2a=p(1)+(1p)(1)+p(2)=4p1choose d in period 1v2b=p(2)+(1p)(0)+p(0)=2p

结论 17.1

在两阶段中,当p>12时,玩家2会选择合作。

结论 17.2

在3阶段的这个囚徒困境博弈中,玩家1和玩家2在第一阶段都会选择合作。

推论 17.1

在T阶段的这个囚徒困境博弈中,T是一个大的值。玩家1和玩家2选择叛变的阶段数被一个常量M限制。而M与p有关,与T无关。

参照

posted @   SNYang  阅读(1035)  评论(0编辑  收藏  举报
编辑推荐:
· 开发者必知的日志记录最佳实践
· SQL Server 2025 AI相关能力初探
· Linux系列:如何用 C#调用 C方法造成内存泄露
· AI与.NET技术实操系列(二):开始使用ML.NET
· 记一次.NET内存居高不下排查解决与启示
阅读排行:
· 阿里最新开源QwQ-32B,效果媲美deepseek-r1满血版,部署成本又又又降低了!
· Manus重磅发布:全球首款通用AI代理技术深度解析与实战指南
· 开源Multi-agent AI智能体框架aevatar.ai,欢迎大家贡献代码
· 被坑几百块钱后,我竟然真的恢复了删除的微信聊天记录!
· AI技术革命,工作效率10个最佳AI工具
点击右上角即可分享
微信分享提示