德州扑克-从入门到入土
规则简介
52 张牌(没有大小王),若干个人,进行许多轮游戏。每轮游戏过程如下:
- 初始有一个按钮(标记该轮的起点)位于某位置,顺时针方向两人依次叫“小盲”、“大盲”。首先由“小盲”和“大盲”依次下“盲注”(不可不下),这决定了这局游戏大致的格局大小。
- 由荷官发牌,每人两张,不公开。之后进行第一轮下注:顺时针依次下注,每个人可以选择与大盲下注一致,或加注至大于等于两倍大盲的金额,或者弃权。
- 由荷官公开另三张牌在中间,称为“翻牌”。之后进行第二轮下注。
- 公开第四张牌在中间,称为“转牌”。之后进行第三轮下注。
- 公开第五张牌在中间,称为“河牌”。每个玩家从自己的两张和公开的五张中确定最大的牌型组合(见下图),之后进行第四轮下注。
- 玩家依次摊牌,牌最大的胜出,拿走所有玩家下的注,按钮顺时针移动一格,进行下一轮。
这个游戏的奇妙之处在于,每个人不是要考虑让这一局赚的尽可能多,而是要根据按钮位置、他人策略来选择合适的策略、伪装,使若干局的总利润尽可能高。
数学模型
这里我们考虑一个基本的问题:德州扑克是纯运气游戏,还是与玩家策略有决定性关系?
由于原游戏过于复杂,这里先考虑两个人、没有盲注、注码恒为
考虑 A 取到
若 A 采用“当
有一种更简洁的算法:由于前面已经算出来了 A 抽到
由于这种简化的问题无法完全反应实际的情况,所以后面我们会计算复杂一点的模型。但在此之前,先让我们考虑一个更有意思的问题:玩家的策略之间的影响。
如果 B 在对局中逐渐发现了 A 的策略,选择使用 A 的策略来进行还击,那么 A 要怎样改变策略才能仍保持优势呢?
类似的分析方式,考虑 A 取到
此时同上计算可得,在这种策略下,A 利润的期望为
这引出了一个新的推论:任意一种策略,都存在一种策略能够战胜该策略,除非无论如何也不下注。这就产生了一个问题:该博弈的平衡点在“永不下注”上。如何打破这种平衡呢?这就是初始的“盲注”的作用了。强制“盲注”的存在使得平衡必须被打破,从而使这个博弈变得可玩性更高。
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步