RLChina2022公开课-博弈论

单纯的动机组合，离散的集合

加入了概率论，以百分比的概率执行不同的的动机。，概率分布

零和博弈、合作博弈、协同博弈

任何一位玩家在此策略组合下单方面改变自己的策略（其他玩家策略不变）都不会提高自身的收益。

从一种分配状态到另一种状态的变化中，在没有使任何人境况变坏的前提下，使得至少一个人变得更好，这就是帕累托改进或帕累托最优化
纳什均衡与帕累特最优的比较
纳什均衡是一个稳定点，但不一定是最优点
帕累特最优是局部较好的一个点，并不代表有多稳定。

前面的博弈里面都有纳什均衡
扩展博弈里面：SPNE

贝叶斯博弈纳什均衡
把隐藏信息保存到一个概率空间
大家不知道隐藏信息具体值，但是知道概率分布

PPAD为基石

总结

posted @ 2023-07-17 21:05 仔仔的棒棒糖阅读(125) 评论(0) 收藏举报

刷新页面返回顶部