海盗分金
------------------------------------
进城的路远离大道,绕过一片小树林.有点荒凉偏僻,但走到一半的时候竟听到路边的树林里一群人吵吵闹闹,仿佛开会一般.偏僻的路上忽然遇到吵闹的人群,多多少少是有点不平常.而程序猿和小驴向来好奇心很重,
小驴嗅了嗅鼻子,"不会是李娟的签名现场吧?听说最近<冬牧场>出了"
程序猿鄙视了小驴一眼:"猫了个咪的!你会把你的签名现场设在荒郊野外么?估计是Win8发布了吧?"
正在争论激烈,里面的人好像听到了我们的对话静了下来,停顿了几秒钟,一声惊天怒吼晴空霹雳般忽的从林中爆裂开来,"苍天负我,我必成魔!"程序猿和小驴顺声望去,五个虬髭大汉个个短装打扮,手握剜心尖刀,猛地从树林里跳出来,眨眼就把小驴和程序猿围个严实.
猫了个咪!
这不是前几天一直威名远播的江南五虎么,近几年他们连续作案,杀人越货,手段残忍,不留活口,据官方通缉抢劫了将近百万.每次又能全身而退,几乎成为传说.他们的照片现在贴的满大街都是,早上吃油条,中午午休,甚至大半夜压马路都能随手摘来一张他们的合影,微微含笑,不知情的还以为是哪个明星组合呢.新闻联播不是说他们被困在某座山中么,大批将士也正在那里进行地毯式搜查,怎么忽然就在这里出现了,声东击西么?看新闻害死人啊!
小驴和程序猿正两股战战时,为首头目摸样的大汉尖刀收回腰间,爽朗一笑:"兄弟莫怕!只要你们帮个忙,保证你们毫发无损,否则...."
"嗯?"
"想我们兄弟五人少尝慕侠义,然佣工江上,不得其志,自觉无以养家,遂杀生弃仁,落草曲悲山.纵行江南八余载,杀伤者众。所过之处但闻其名,不知其所踪也。今得金币百玫,然如何分之,终须有个好歹."
"如何帮?"
" 我们五个,个个自以为聪明理智,心狠手辣,不顾兄弟感情,只顾自己最大利益,可是一旦规则确立,决不食言,我们现有100枚金币,分配方法如下: 老大,老二,老三,老四,老五依次提出一个解决方案,由老大先开始,如果这个方案能够得到一半或者一半以上的人同意,就按照这个方案进行,如果不能得到一半或者一半以上的人同意的话,则提出方案的人必须杀掉,然后由老二继续提出方案,依次类推,直到金币分完,现在请你们帮忙想一个办法分这些金币"
小驴听了,略微思索了一下,微微颔首而笑:"这个并不难,让我来解觉你们的难题":
强盗的游戏规则
------------------------------------
我们用H1,H2,H3,H4,H5分别代表五个强盗.他们的分配原则如上所述,由H1,H2,H3,H4,H5一次提出方案,若方案得到一半或者一半以上的人同意,则执行方案,若未通过,则杀死方案提出者,由下一个人提出方案,依次类推.
强盗的特点:
1.他们聪明理智,不会顾及兄弟情义,
2.他们不会破坏既定规则.
3.他们首先要活下来
4.其次,他们要实现自己利益最大化.
5.在34条件相同的情况下,优先选择把别人杀死.
爆发的小驴
------------------------------------
直觉告诉我们,第一个提出分配策略的人貌似生命垂危,因为他要面对最多的分配人群,为了保住性命,他最好平分金币,或者自己少拿以讨好众人以通过大家的裁决.实则不然,逻辑告诉我们,与其苦苦冥想自己的最优策略,不如想象最后剩下的人会做什么决策,然后一直上推到自己的下一个人,就会发现任何一个决策者的最大威胁正是来源于自己的下一任决策者.这个博弈模型中任何策略分配者想让自己策略获得通过的关键是要预知到挑战者的最优策略,并用最小的代价拉拢挑战者最优策略下失意人群来通过裁决.
现在让我们想象最后一个决策者会做什么事情.
1.倘若只留下H5,他自然会将这100金币归入囊中,即策略为:
H1
|
H2
|
H3
|
H4
|
H5
|
kill
|
kill
|
kill
|
kill
|
100
|
2.事实上,我们发现H5不可能实现他的策略,因为若是由H4主持分配,在H4执行其最优策略时,他会选择给自己100金币,给H5 0 枚,即便H5不同意,H4也通过了50%的裁决,因为H4必定会投自己一票,通过裁决,H4是聪明的,他不会投自己否定票来让H5主持分配,H4的策略为:
H1
|
H2
|
H3
|
H4
|
H5
|
kill
|
kill
|
kill
|
100
|
0
|
3.再来考虑H3,显然无论H3提出什么策略.H4都会坚决的反对,即便H3给出策略(0,100,0),H4也会投反对票,因为H4依旧能在H3死亡的情况下得到100金币.而各个强盗总是乐于在实现自己最优的情况下杀死其他海盗.
H3显然感到了挑战者H4的威胁,为了打败H4,H3不得不拉拢H4最优策略下的失意人士H5,这时H3只要付出一个金币的代价就可以让H5投赞同票.于是H3可给出的最优策略为:
H1
|
H2
|
H3
|
H4
|
H5
|
kill
|
kill
|
99
|
0
|
1
|
4.现在来考虑H2, H2为了打败H3,至少要拉拢H4,H5中的一人,如果拉拢H5, ,付一枚金币,H5会觉得和在H3的策略中待遇一样,会选择反对H2而杀死H2的.因此H2要拉拢H5至少要付出2枚金币给H5,这并不划算,因为要拉拢H4只需一枚H2是聪明的,他会选择拉动H3最优策略下的失意人士H4,于是,H2的策略可为:
H1
|
H2
|
H3
|
H4
|
H5
|
kill
|
99
|
0
|
1
|
0
|
5.最后我们来考虑H1,H1至少要拉拢其他四人中的两人才能通过裁决.无疑H2会坚决的反对H1的策略.拉拢H4会额外浪费一枚金币,所以H1会选择拉拢H3和H5,于是H1的最优策略为:
H1
|
H2
|
H3
|
H4
|
H5
|
98
|
0
|
1
|
0
|
1
|
小驴的多次博弈进入纳什均衡
--------------------------------------------
强盗头子看了看结果,不禁有些吃惊:"我不但能活下来,而且得到了最多的金币?"
小驴道:"如果逻辑推理没有漏洞,那么结论就必定站得住脚,即使它与你的直觉矛盾。"
强盗头子:"果然是没有永恒的朋友,只有永恒的利益"
小驴又道:"这只是一次博弈, 倘若多次分金,博弈就会进入纳什均衡.这时候就会有多种情况出现,可能下次分金时候由H2主持最优策略分配,说白了这就是民主制度下的分赃制,在民主的幌子下,其实利益者依旧存在.也可能四人抛开H1从新暗自设定游戏规则,除掉H1,从新分配,可能按原来规则,也可能真正平分,也可能平分只是一个幌子,利益者仍暗中作祟.如太平天国的平均制度.总之会有各种策略规则出现,从而进入平衡''
强盗头子佩服到:"看来今天我真是受益良多啊"
小驴道:"H1的最优策略是建立在强盗游戏规则的前提下的,现实世界中的人不会都是绝对理性,任何一个条件的改变都可能给H1带来生命的危险,由于信息的不对称性,可能有强盗H2趁机暗自散播谣言宣称H1实际上有200金币,那么H1还能在最优策略下走出么?因此H1在游戏规则外进行分配的时候首先要考虑他的兄弟够不够理性够不够聪明,否则谁先分谁倒霉."
强盗暗暗点头,"还好我的兄弟这次够理性了"
一直站在旁边静静不语的程序猿也接着道:"如果理性,那么在临界点之下,以决策者的身份出场,冒最大的风险,就会得到最大的利益。"
强盗不解的问道:"临界点?什么是临界点?"
程序猿看了看强盗头子,静静的问:"你有没有想过有更多的强盗来分这100枚硬币?"
<未完待续>
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· 如何编写易于单元测试的代码
· 10年+ .NET Coder 心语,封装的思维:从隐藏、稳定开始理解其本质意义
· .NET Core 中如何实现缓存的预热?
· 从 HTTP 原因短语缺失研究 HTTP/2 和 HTTP/3 的设计差异
· AI与.NET技术实操系列:向量存储与相似性搜索在 .NET 中的实现
· 周边上新:园子的第一款马克杯温暖上架
· Open-Sora 2.0 重磅开源!
· .NET周刊【3月第1期 2025-03-02】
· 分享 3 个 .NET 开源的文件压缩处理库,助力快速实现文件压缩解压功能!
· [AI/GPT/综述] AI Agent的设计模式综述