博弈论---3、囚徒困境
博弈论---3、囚徒困境
一、总结
一句话总结:
1、“囚徒困境”就是满足“背叛诱惑 > 合作报酬” 和 “受骗支付 > 背叛惩罚” 条件的博弈。
2、解决“囚徒困境”就是让“囚徒困境”的两个条件不成立:也就是让“背叛诱惑<合作报酬”和“受骗支付<背叛惩罚”
3、生活中的各种合作与背叛的事情,我们也可以提高合作报酬,提高背叛惩罚来降低被背叛的几率。
二、囚徒困境
博客对应课程的视频位置:3、囚徒困境-范仁义-读书编程笔记
https://www.fanrenyi.com/video/36/326
囚徒困境例子
A和B是犯罪同伙,被隔离审讯。
如果A和B都坦白罪行,会都被判刑8年;
如果一人坦白,一人不坦白,坦白的人直接释放,不坦白的重判15年;
如果两人都不坦白呢,则证据不足,都只判1年。
这,就是著名的“囚徒困境”。
...
虽然“都不坦白”是最优策略,但“都不坦白”是经不起考验的最优策略:我如果单方选择背叛,将立即获释,诱惑太大;而且就算我守口如瓶,万一他背叛了呢?我会被判15年,风险太高。
“都坦白”呢?那两人都获刑8年。这时,如果一名囚徒单方决定守口如瓶,他的8年刑期将立刻变为15年,而另一人则被释放。对于守口如瓶的人,这一点好处都没有。
所以,“都坦白”,是囚徒困境中唯一稳定的“纳什均衡”。
那,这背后的博弈论原理是什么呢?
囚徒困境
一个典型的囚徒困境,其实就是满足两个条件的博弈:
1、背叛诱惑 > 合作报酬
合作报酬是判刑1年,背叛诱惑却是立即释放。
2、受骗支付 > 背叛惩罚
背叛惩罚是判刑8年,受骗支付却是判刑15年。
这就是“囚徒困境”的基本原理。
...
那,要怎么“破”?
1、让“合作报酬 > 背叛诱惑”
我们看看电影里常见的桥段:
你很讲义气,死不招供,然后就会有人给你带话:大哥说了,你家里的事情不用担心,老人、嫂子、孩子,我们都会照顾好。你出来那一天,还会有一大笔dollar...这就是提高“合作报酬”;
一个坦白了的人刚被释放出来,坐上自己的汽车,汽车发动的一瞬间,bang!!!就算把你释放出来,也一样没有好果子吃,这就是降低“背叛诱惑”;
2、让“背叛惩罚 > 受骗支付”
我们还是看看电影里面的桥段:
电影里的古惑仔们,大多都很讲义气,崇尚“忠义”,不讲义气会被整个江湖唾弃,这种文化会在一定程度上,增加“背板惩罚”;
什么?你被人出卖了?大哥除了会给你钱,帮你赡养家人之外,你的仇人就是大哥的仇人。不管他走到天涯海角,你放心,这仇我帮你报了!这,就是降低“受骗支付”。
小结一下
“囚徒困境”就是“背叛诱惑 > 合作报酬”,“受骗支付 > 背叛惩罚”。
怎么破?
第一,提高合作报酬,降低背叛诱惑;
第二,提高背叛惩罚,降低受骗支付。
生活中的各种合作与背叛的事情,我们也可以提高合作报酬,提高背叛惩罚来降低被背叛的几率。
你,学会了么?
...
参考:https://www.toutiao.com/i6493100684932547086/