转:扑克牌里的博弈之道
扑克牌里的博弈之道
作者:英国《金融时报》专栏作家提姆•哈福德(Tim Harford) 2006年6月14日 星期三
2000年的拉斯维加斯世界扑克大赛(World Series of Poker)创纪录的吸引了500名选手前来参赛。在为期4天的比赛中,参赛者们逐渐被淘汰出局,直到剩下最后两名选手,在这场扑克牌中的顶级玩法——得州扑克玩法(Texas Hold ‘Em)大赛中进行巅峰对决。在这两名选手中,经验较为丰富的那位是个传奇人物:他叫T•J•克卢捷(T.J. Cloutier), 62岁,来自得克萨斯,是个职业赌徒,被很多许多人视为全世界最棒的扑克玩家。他的对手名叫克里斯•弗格森(Chris Ferguson),是一位37岁的计算机科学家,来自加利福尼亚,从1996年才开始参加这项大赛,而且所获得过的最好成绩不过是第四名。
弗格森可能相对是个新手,但却不容轻视。他有个绰号叫“耶稣”,因为他的脸深藏在浓密的络腮胡子和齐肩长发之后,而且还带着反光墨镜和一顶大号牛仔帽。
弗格森在比赛过程中从不说话,绝不表现出任何人类情感特征;他也没有过多注意其他选手因紧张而出现的面部痉挛,而是宁愿从牌面上获得他的全部信息。那个星期,他在拉斯维加斯一路过关斩将,带着10倍于对手的筹码进入决赛。
克卢捷是一位久经沙场的老手。他曾是一名专业橄榄球运动员,拥有一副宽厚的肩膀和一双大手,连扑克牌在他手中也显得很小巧,而他在牌桌上也格外引人注目。凭借出色的牌技和非凡的运气,克卢捷一点一点地消耗掉了弗格森在筹码上的领先优势。当他把弗格森引入危急境地时,他在筹码数量上仅落后一点点。他跟注时只增加了17.5万美元,就迫使弗格森追加至60万美元。而后,克卢捷把大约200万美元的筹码推进赌池——他全押上了。
弗格森开始犹豫,他计算着获胜的几率。克卢捷手中的牌可能比弗格森预想的更好。不管怎样,克卢捷这招很漂亮,如果弗格森这时不再跟注,将使他的对手遥遥领先。
另一方面,如果弗格森继续跟注而且获胜,那么,这场世界扑克大赛的胜利者就是他。他估计获胜的几率大概是1/3,而这实际上相当于胜利在望了。
在扑克游戏中,牌手们下注或跟注的目的是为了有权在每一手牌的最后进行“摊牌(showdown)”比大小。一个牌手如果不下注或跟注的话,就必须退出那一手牌的比赛。赌池中累积的所有筹码,构成了每次摊牌的输赢奖金。谁手中的五张牌最大,谁就赢走赌池中所有的钱。
大牌,比如“顺子”(五张牌连号)或者“葫芦”(三张同号牌加两张同号牌),最让人羡慕,但拿到那样的牌纯粹靠运气。赌博的技巧就在于下注和看懂其他选手的赌注。大赌注可能会吓跑那些没有意识到自己的牌其实最大的牌手,或者可能仅仅是确保你的“葫芦”获胜时,赌池中能有一大堆筹码。
在得州扑克玩法中,每位选手只拿2张牌。其它3张则从5张公用牌中挑选,与手中的牌进行组合。这5张公用牌分为几轮亮在牌桌上,以便增加几轮加注机会。在公用牌全部亮出之前,选手们只能猜想他们手中的2张底牌与那5张公用牌的匹配程度。大赌注往往出现在这一过程中,当然,决不会比克卢捷和弗格森的赌注更大了。
最后,经过几分钟的激烈思考后,弗格森摘下帽子和墨镜,突然缩了一下身体,暴露出他人性中疲惫和脆弱的一面——在一旁观战的作家詹姆士•麦克马纳斯(James McManus)在他描写这届比赛的小说《决胜河牌》(Positively Fifth Street)中写道:“他更像耶稣了。”(麦克马纳斯本人在此次大赛中被淘汰,排名第5。)之后,弗格森决定跟注。(译者注:在得州扑克中,亮出第5张公用牌的一轮叫做河牌,又叫第五街。)
克卢捷亮出了底牌,是一张A和一张Q,而弗格森是A和9。由于再也没有筹码可下注,5张公用牌以慢得令人窒息的速度被掀开。弗格森略微高估了自己的胜算:应该是1/4。他必须拿到一张9,才能和手中的牌凑成一对,而且还不能出现Q,让克卢捷凑成一对。当最后一张牌——9——出现在桌上时,弗格森立即意识到发生了什么,之后,鸦雀无声的人群才反应过来。他高举双臂,跳将起来,用瘦骨嶙峋的双臂给了克卢捷一个拥抱。克卢捷则平静地接受了失败。据麦克马纳斯在书中描述,这位大师当时说道: “这就是扑克。”
弗格森此后几年的征战纪录已经证明,当年出乎意料的结局并非侥幸。在历届世界扑克大赛决赛中,只有4个人赢的钱(相当于在高尔夫比赛中的晋级奖金)超过弗格森,而且在2000至2004年期间,弗格森赢得世界大赛的次数也超过了任何一位对手在10年里的夺冠次数。因此,这位“耶稣”有足够的理由被尊为21世纪最成功的选手,而他的胜利也超越了个人的范畴:人们长期以来试图将数学的严谨运用于扑克游戏心理较量,这次胜利标志着这一过程中一个转折点。
据报导,弗格森在比赛中赢取的奖金超过500万美元。在试图利用博弈论(数学的一个分支)来征战扑克牌桌的新一代选手中,他的表现最为出色。这是一场奇怪的竞争,是带着眼镜的数学怪才与冷漠赌徒的抗衡。但最奇怪的事情是,扑克中的确是有学问可做的。
上世纪20年代末,世界上最聪明的一个人决心研究出扑克牌游戏的正确玩法。后来曾主持计算机和原子弹开发工作的数学家约翰•冯•诺伊曼(John von Neumann),当时冒出了一个诱人的新想法:他希望将数学原理运用在社会科学领域,并且创造一种理论,分析种种事件的可能性,比如外交谈判破裂、敌对双方意外合作等,甚至是爆发核恐怖的可能。他认为,如果人们想要一种可以解释日常生活的理论,就必须从解释扑克游戏的理论开始——即博弈论。他表示:“现实生活中充满了虚张声势和迷惑他人的小把戏,而且人们也经常揣摩其他人如何考虑自己的意图。这就是我的理论所研究的博弈。”
对于数学家来说,研究虚张声势、骗人诡计和心理揣测等问题都是没有前途的。不过,如果有人适合对此进行研究的话,那么他就是冯•诺伊曼。为他撰写传记的威廉•庞德斯通(William Poundstone)表示,冯•诺伊曼那值得夸耀的计算本领众所周知。二战之后,冯•诺伊曼在普林斯顿大学(Princeton)工作,而他的能力甚至可能超过了其同校同事爱因斯坦(Albert Einstein)。他帮助设计了全球计算速度最快的计算机,之后又证明了他的计算速度比这台计算机还快。没有人对此表示惊讶。他的同事们开玩笑说,他是个在深入研究过人类之后能惟妙惟肖地模仿人类的“半仙”。
为了研究扑克游戏,冯•诺伊曼必须开创新天地。长期以来,人们一直利用概率理论分析运气游戏(games of chance)的取胜几率。而象棋等具有严格逻辑性的游戏需要非凡的计算能力。但扑克则完全是另一种游戏。
扑克游戏的多数重要信息都是隐藏的;每个玩家只能看到其中的一部分,他们必须通过观察其他玩家的行为,把各种信息拼在一起,获得更多信息。由于赢家通吃,因此,赌注越大,失败的代价也就越大。然而,在许多牌局中,尤其是在两个技术高超的玩家之间,不会出现摊牌的时刻:一个玩家大笔加注,足以吓退其他玩家。总之,玩家下注的多少与他持有的牌的好坏之间没有直接联系。
扑克中的虚张声势引起了冯•诺伊曼的兴趣。菜鸟们错误的认为,虚张声势仅仅是一种用坏牌赢得所有奖金的途径。在1972年世界扑克大赛的决赛中,著名赌客阿玛里洛•斯利姆(Amarillo Slim)赢得了比赛,因为他在比赛中屡屡使用虚张声势的手法,而当他最后持有一手“葫芦”(非常大的牌),把所有筹码全押上的时候,他的对手认为他又在虚张声势,因此选择跟进,最后输掉。从不使用这种手法的玩家永远不会赢得大额奖金,因为在他非同寻常地选择加注的情况下,其他人会放弃,不会跟进下大赌注。
还有另一种虚张声势的技巧:当你手中有好牌时,假装牌不好。在1988年的世界扑克大赛中,中国出生的Johnny Chan(绰号“东方快车”(Orient Express),因为他赢钱的速度极快)放弃了所有加注的机会,不声不响地跟注。在最后一圈下注时,他的对手相信Johnny Chan没有好牌,因此把所有的筹码全部押上。Johnny Chan随即跟牌,最后亮出了一个“顺子”(好牌),赢得了70万美元奖金,并摘取了世界冠军的头衔。
这些故事似乎都关于心理学,而非数学。尽管Johnny Chan和斯利姆都对计算几率以外的数学知识毫无兴趣,但冯•诺伊曼的理论可以解释他们所做的一切。在1944年出版的、与经济学家奥斯卡•摩根斯坦(Oskar Morgenstern)合著的开创性著作《博弈论与经济行为》(A Theory of Games and Economic Behavior)中,冯•诺伊曼表示,你只能在牌很差的时候虚张声势,手中的牌差强人意的时候不要使用。
理由很简单。一把普通大小的牌可能打败另一把普通大小的牌,因此值得你勉力坚持到最后,进行低赌注的摊牌。一把烂牌只有在对手盖牌放弃时才能胜出,因此,拿到一手烂牌,要么强势出击,要么彻底放弃;事实上,最出色的玩家在大张旗鼓下注时,他们手中的牌通常奇烂无比。冯•诺伊曼的模型还凸显了虚张声势的另一好处:它迫使对手频繁跟注,因此,一把好牌会赚得更多。
冯•诺伊曼的书红极一时,但学者们很快醒悟过来:他们发现博弈论的局限性太大,很难应用于现实世界。虽然有少量图书“被职业赌徒买走”——正如普林斯顿大学出版社(Princeton University Press)在1949年窘迫地表示,但这本书的销量并不好。
直到上世纪80年代晚期 ,扑克游戏对数学家而言才开始变得安全一些,这时一些大型娱乐公司迁至拉斯维加斯,开始提供一些文明方式的让人把钱掏出来。这些数学怪才很受欢迎,但他们依旧很难将博弈论转变为牌桌上的胜利。
冯•诺伊曼1957年去世。在他去世之后的很多年里,学者们也在苦苦思索,如何将博弈论运用在经济、生物及军事战略等现实生活中的问题上。其中一个主要困难在于,人类智力是完全不可靠的。有关冯•诺伊曼是“半仙”的玩笑非常贴切:他在设计其“零和游戏”模型的时候,设想的是两位与他本人同样聪明的“半仙”对阵。但我们不能总是假定一定能遇上优秀对手:当你对手的聪明程度并不足以运用精明的战略时,提防这些策略是没有任何意义的。
这一问题在扑克游戏上尤其突出。面对可能过多或过少虚张声势的弱手时,在面对实力较弱的对手时,一套在理论上无懈可击的扑克策略可能会错过战胜他的大好机会,因为这样的对手可能过度虚张声势或极少这么做。过度虚张声势的情况下需要采取保守策略诱使他犯错,而在后一情况下要让对手犯错则需咄咄逼人一些。但博弈论的假设前提是,这种情况不会发生。
应用博弈论的另一个困难是,扑克游戏颇为复杂,即便是运算速度最快的计算机,也无法找出最佳解决方案。如果某位玩家一秒钟可以思考10种可能性,那他可能不得不在银河系诞生的那一刻,就开始为两位德州扑克玩家计算出一个合乎博弈论的解决方案。
一个希望运用冯•诺伊曼理论的真正扑克玩家,在某种程度上可能必须具备超越这位大师本人的运算能力。或者,他可能不得不找出捷径,在不严重影响其推测质量的前提下,简化这一数学问题。他还必须认识到,在对手的牌技很糟糕时,有必要把博弈论策略搁在一边。这时需要采取非常手段。
1988年,刚刚兴起的互联网开始作出响应。当时,网上出现了一种新现象:互联网中继聊天扑克游戏(IRC Poker)。这是一种简单程序,使用名为“互联网中继聊天”(internet relay chat,当今在线聊天室的前身)的程序来发牌,主持互联网玩家之间的扑克游戏。这种游戏并不涉及金钱输赢,只不过是玩家们可以有机会击败世界上最厉害的数学怪才们。
克里斯•弗格森很快成为这一小群人中的佼佼者。作为加州大学(University of California) 洛杉矶分校计算机科学专业的一位博士研究生,弗格森当时正研究人工智能,利用博弈论帮助电脑玩棋盘游戏。他在早年就接触到了扑克游戏和博弈论。他的家人都是疯狂的游戏玩家,他的父亲是一位数学教授,在加州大学洛杉矶分校教授博弈论。周末时,年轻的弗格森会驱车到拉斯维加斯,与其他游客玩非常保守的扑克游戏,用赢来的钱支付酒店账单。但对于一个希望深入研究这种游戏的人来说,互联网中继聊天扑克游戏是个更好的实验室。里面有原始数据供他分析,其中充满着激烈的竞争,让他着迷。
弗格森开始利用博弈论研究,在拿到什么牌的情况下可以虚张声势,虚张声势的使用频率,以及在拿到一手好牌的情况下,如何在加注太少和加注太多、吓退对手之间的寻找平衡。他记住了他所玩的每场牌局的结果。他的方法与冯•诺伊曼一样,但在强大电脑的帮助下,他能够比这位前辈分析更为实际的扑克游戏。
很快,弗格森开始得出一些出人意料的结论。他指出,老派扑克专家在拿到好牌时加注太多。他们加注很多,目的是希望在牌面仍然领先时赢得赌池中的奖金,但弗格森指出,这时加注可以少些,鼓励对手抱着牌面改观的希望跟进加注。有时,那些对手会很幸运,但总的来说,有好牌的玩家将在加注较少的情况下赢得更多的钱。
“我向一些倍受尊敬的扑克玩家展示了我的大量研究,”弗格森告诉我,“他们对此嗤之以鼻,但我认为,这是因为他们对此不了解,所以不同意我的研究结果。但我知道我是对的,而这种分歧表明,数学可以击败全世界最优秀的玩家。”
自信是弗格森的个性:他知道,博弈论会带给他优势,不是因为他在赌桌上的佳绩,而是因为这个理论是正确的。当他在2000年击败T•J•克卢捷时,几乎无人怀疑弗格森对扑克游戏有着深刻的洞察力。
到2005年,世界扑克大赛的规模已经超出了老旧的比尼恩马蹄铁赌场的接纳能力,比赛移至拉斯维加斯大道(Las Vegas Strip)附近的里奥酒店(Rio Hotel)。巨型大厅里摆放着数百张牌桌,6000名选手摆弄着他们陶土筹码,众多筹码相互碰击发出的清脆声音,犹如大厅里藏着一群疯狂的蟋蟀。
与需要支付1万美元入场费的场内比赛相比,很多人注册参加了在网上进行的比赛——人数最多的时候,全球有逾10万名玩家同时在网上玩扑克赌钱,远非互联网中继聊天时代所能企及。电视直播的扑克游戏满足了人们的需求,而人们的需求也推动了电视直播的火爆。在电视台开始安装摄像头,拍下每位玩家的底牌之后,这种全世界最不吸引观众的运动,变成了一种引人入胜的比赛,同时弗格森等玩家也变成了巨星。当我和他走在里奥酒店的赌场时,每隔几秒钟就有人找他合影或签名。而他每次都以老练的优雅态度作出回应。他承认:“我喜欢这样。”
扑克游戏步入新时代,所有人都可以参加,意味着有头脑的玩家已经有了追随弗格森的勇气。耶鲁大学(Yale)数学家、扑克书籍作家马特•马特罗斯(Matt Matros)表示:“如果只有酒吧里的不法之徒玩扑克的话,那你就不会在这看到这些医生和律师了。”马特罗斯已在比赛中赢得了逾75万美元。他确信,在最高水平的扑克游戏中,博弈论将成为必备武器。麻省理工学院(MIT)毕业生、博弈理论家安迪•布洛赫(Andy Bloch)持同样观点。也曾获得过扑克比赛冠军的布洛赫认为,双人版德州扑克的博弈问题不久将得到解决,意味着牌桌上的每一个决定都将有一个确定的正确答案。
在与扑克高手进行双人对决时,通晓博弈论的玩家无疑具有最大的优势。弗格森在两届新的双人淘汰制全明星扑克大赛中均闯入决赛,并在其间击败了克卢捷。如果布洛赫和马特罗斯是正确的,那么每一位认真的玩家将自然不得不学习双人扑克的招数,就像象棋选手要记住几十种不同开局套路一样。
但在多数情况下,扑克游戏不是双人对决,而且多数玩家参加的牌局也远远不是冯•诺伊曼假设的理想牌局。多数扑克新手不是数学专家,但却贪得无厌的希望赢很多钱。“如果你想通过打扑克赚钱,那你做这件事的理由就错了,”弗格森表示,“你必须喜爱这种游戏,而且你必须愿意付出努力。”
弗格森知道,大量新手的参与,打破了博弈论有关高手对决的假设。其他一些顶级专业人士认为,这将会一直限制该理论的用武之地.
肩膀宽厚、身高超过6英尺的霍华德•莱德勒(Howard Lederer),因其在比赛时喜欢深思熟虑而被赋予了“教授”的绰号。当我在里奥酒店拖住他进行交谈时,他告诉我,低手太多,使得博弈论无法成为扑克高手的主要武器。“只有在与另一个行家进行对抗的情况下,才能完全依靠博弈论。这种情况极其少见。一般情况下,打扑克主要靠心理学。你需要懂一些博弈论,但心理学的作用更大:当人们心理比较脆弱的时刻控制住他们,左右他们的心理。”
如果莱德勒是正确的,那么大量新手的参与正破坏着博弈论的用途。博弈论告诉你如何避免在高手面前输局,而不是如何击败实力较弱的对手。参加比赛的“鱼腩”越多,博弈论的用武之地就越少。因此,冯•诺伊曼的理论遗产或许只能指望非同寻常的新一代玩家来继承了。
让我们回到比尼恩马蹄铁赌场。这里距离里奥酒店很近,乘坐出租车只要片刻时间。在2005年世界扑克大赛举行期间,另外一个锦标赛在这里上演。这里的场面更像个网吧而不是赌场,绿色的台面被纵横交错的电缆所取代,6台电脑彼此相对,一分钟之内,看不到发牌猜牌、下注跟注、摊牌收筹码,就已经进行了数十局斗牌,而这些扑克牌和筹码只存在于电脑空间之中。
当比尼恩马蹄铁赌场1970年主办世界扑克大赛时,只有受到邀请的人才能参加比赛;几场比赛之后,所有人投票将世界冠军的头衔授予了经验丰富的约翰尼•莫斯(Johnny Moss)。2005年的首届世界机器人扑克大赛(World Poker Robot championship)重拾了这个传统。这里的6个软件程序都是应邀参加比赛的,而真正的冠军勿庸置疑:艾伯塔大学(University of Alberta)游戏程序研究组——7年来,它击败了所有电子对手,现在他们受邀担任比赛裁判,而不是参赛选手。
艾伯塔代表队的达尔斯•比林斯(Darse Billings)和我在附近一张桌子坐了下来。他是队中最厉害的扑克玩家,也是一个博弈理论家,很乐意与一个对约翰•冯•诺伊曼有所耳闻的人聊天。比林斯有一张圆圆笑脸,长着短短的、毛茸茸的胡子,有点像玩具熊,但他声称,他在输牌的时候可不那么惹人喜爱。他说:“我曾是互联网中继聊天扑克游戏的绝顶高手。”言语之中流露着骄傲。后来怎么了?“克里斯•弗格森开始玩牌,并且超越了我。”
比林斯和同事们还没制造出能够打败弗格森的软件。弗格森被视为一个特别的挑战,因为他不会因为对手是一个没有任何肢体暗示的机器而受到干扰。但他们对挑战一个拥有人工智能和博弈论博士学位头衔的世界冠军很感兴趣。但是,在目前,几乎任何一位顶级人类玩家都能战胜电脑。在世界机器人扑克大赛结束后进行的两场表演赛中,知名扑克玩家、绰号“隐形炸弹手”的菲尔•拉克(Phil Laak)参加了与机器人的比赛。狂热的支持者高喊着“人类加油!人类加油!”,他很快地战胜了艾伯塔的程序和一个名为PokerPro的新科状元。没人对此感到惊讶。
在扑克游戏中,人工智能研究人员目前面临的挑战与冯•诺伊曼在大约80年前所遇到的挑战一样,即如何理解那些骗人的诡计。目前,冯•诺伊曼的博弈论仍是最成功的招数,这一点得到了强大的计算机程序SparBot的证实——它击败了大多数登陆艾伯塔网站想要一试身手的人。比林斯预言:“我相信电脑最终将会比所有人类都玩得更好。”弗格森对此表示赞同:“如果用在扑克机器人方面的资源达到象棋机器人的十分之一,那么它们早就打败我们了。”
在互联网中继聊天扑克游戏时代,网络扑克游戏倾注了创建者们无穷的热情,而许多评论人士现在担心,今后它将毁于扑克机器人之手。网上扑克游戏每天的赌金估计超过2.5亿美元——这无疑是一个巨大的诱惑,刺激人们编写一个软件程序来捕猎全球各地毫无戒备之心的“鱼腩”。通过玩网络扑克游戏,一位出色的玩家一个月能挣数千美元,那么,如果这个玩家被无数居心不良的电脑程序所取代,情况会怎样?
比林斯确信,这种情况在短期内发生的风险被夸大了。他自己的SparBot是一个学术项目,不是为了钱而玩扑克的;同时他对其它程序不屑一顾,就是因为它们还不够好。“与电脑带来的威胁相比,对电脑的恐惧是个更大的问题。在互联网上有几十个扑克机器人,但它们都在赔钱。”但他承认,人们迟早能够下载一个能战胜世界冠军的免费电脑扑克软件。就这一点而言,人们可能无需担心会与一个身分不明的对手在网上赌钱。
一个颇具讽刺意味的结局却越来越有可能成为现实:最终,网上扑克游戏将被那些能够掌握约翰•冯•诺伊曼博弈论的扑克玩家所主宰,那就是电脑。同时,人类将回到有血有肉的赌场世界,在那里,一个因紧张而出现的面部痉挛能比一千次计算告诉你更多。像弗格森这样的人类电脑已经创造出一个新的行当,但只要牌桌上有“鱼腩”,“哈巴狗”皮尔森和玛里洛•斯利姆那种古老的技巧就不会消失。研究扑克游戏的数学家留下的最大遗产,不是颠覆传统的扑克游戏,而可能是将这种游戏变得对我们其它人而言比以前更有趣。
德州扑克人机大战
“第一届人类对机器扑克锦标赛”,组织方为此提供了5万美金奖,资深职业牌手最终战胜了阿尔贝塔大学一个人工智能研究团队开发的电脑程序,而双方在赛后强调,这次比赛纯粹是为了科研需要,绝非为赌博者提供福音。 一般的公认是扑克要比下国际象棋或者西洋跳棋难,因为打扑克牌更要求在讯息不完整的情况下根据预判(或者说,运气和赌博心理)进行,这就阻止了电脑的计算能力像下棋那样充分发挥,因此设计扑克牌程序也比下棋程序要困难得多。科学家必须开发更多不同的策略和技巧,来应付层出不穷难以预计的牌手计谋,但如何识别人类会采用的虚张声势等冒险行径,对于电脑程序而言还是个难点。
过去科学家的研究集中在象棋和跳棋上,1997年,超级计算机“深蓝”战胜世界棋王卡斯帕洛夫堪称“电脑压过人脑”的里程碑,阿尔贝塔大学的研究人员们早在1994年就研究出可以战胜世界级棋手的程序,而本月早些时候他们宣布,升级过的象棋程序“永不会输”,完全先进于任何人类棋手。
该大学对于扑克牌程序的研究则始于16年前,但进展却始终没有像象棋程序那么有效,“扑克牌程序的研究更要求在实战中进行。”阿尔贝塔大学计算机科学部主任沙弗尔表示,“扑克牌是一种我们成为不平等讯息的游戏,你不知道对手的牌,这就要求你必须处理的是各种可能性。”
沙弗尔认为,随着这套扑克牌程序的不断完善,未来也将对股票程序的开发和优化大有帮助,因为两者都是建立在部分讯息的基础上分析和预判各种可能性,“这个类型的程序也许不能帮你更好地赌博,但它能帮你投资……或者消费。”
菲尔·拉克和阿里·伊斯拉米,两位排名世界顶尖的洛杉矶扑克牌手,在本周惊险战胜一个名为“Polaris”的电脑程序后证明:玩扑克,人脑还是比电脑行。
这项比赛采用的是得克萨斯纸牌(一种在拉斯维加斯风行的扑克游戏,后被开发为一个电脑游戏),于本周一在加拿大温哥华一家宾馆会议室开战,比赛场面非常奇怪——一边是疲惫不堪的两位职业牌手,一边是疲惫不堪的一排计算机科学家,再加上一大帮同样疲惫不堪的观众,这场马拉松大战直到当地时间周二深夜11点才结束,拉克和伊斯拉米凭借第四局和最后一局的微弱点数优势胜出。
不同于象棋比赛,扑克大赛不需要极端的注意力集中和长时间的安静,因此比赛过程更像是个节日,数百名观众,而当人类最终赢得这场比赛后,闷热不堪的会议室里爆发出阵阵欢呼。
“我很高兴比赛终于结束了。”30岁的伊斯拉米赛后承认,和电脑的比赛比他职业生涯的此前任何一场都要绞尽脑汁,“一上来电脑打击我时就像打个鼓一样容易。”曾当过电脑咨询员的伊斯拉米则盛赞了这个程序以及计算机科学家们,“我们居然赢了,太意外了……电脑现在已经如此先进,未来将越来越难战胜它。”不过科学家们质疑道,鉴于牌手的计算机专业背景,他们要比其他顶尖高手能更有效地对付程序。
随着这次人机大战,科学家们将进一步优化这个程序,因此在开战前就被普遍认为是人类在扑克牌比赛中最后一次战胜电脑的机会。在这场整整持续了两天的比赛的前三局,人类和电脑各是一平一胜,因此第四局最后几分钟至关重要,结果人类在这微妙的时刻占了上风,用计算机科学家、比赛裁判迈克尔·李特曼的话来讲,拉克和伊斯拉米是“显而易见的赢家。”
“整件事情最精妙的地方在于,我们赢了,但没有以巨大的优势胜出,电脑只是差了一点儿,那就是真实的差距所在。”拉克说,“这就好比你要在一项比赛里战胜500个人一样。”为了确保比赛的公正性,两名牌手和电脑对战时都使用了完全相同的牌局,而和真人对局另外一个大不同的地方是,电脑绝对不会察言观色,职业高手们真假难辨的表情、动作无从诱导他们的对手,这是电脑牌手的优点,但从另一方面来讲,也让打牌丧失了最有趣的一部分。
2007-7-28 09:56 csdn2
在德州扑克中到底是电脑厉害,还是人脑厉害呢?
艾伯塔大学的开发人员认为,如果他们的电脑程序"北极星"与专业玩家菲尔·雷克和阿里·伊斯拉姆对战2000手德克萨斯扑克的话,"北极星"将表现出色,为此他们设下5万美元的赌局。
这种事情在象棋比赛和巴加门15子棋比赛中已经发生过:最终电脑都战胜了人类。
扑克是更加复杂的运动,而且至今不能被冷冰冰的机器所掌握,但艾伯塔大学的研究员们愿意接受这个挑战。
菲尔·雷克与阿里·伊斯拉姆将在7.23和7.24日于温哥华举行的人工智能发展协会的年会上进行挑战。比赛分为4次,每次500手。
实验将尽可能地模拟扑克与生俱来的随机性。在每次比赛的终了,将人类的资金总和机器的资金总和比较以决出胜负。
"北极星"实际上是由多个执行不同功能的电脑程序相互协作的。其中一个玩得非常凶,但并不十分留意对手的玩牌风格。另外一个则会分析对手的强弱从而相应地调整玩法。
不过,所有的程序都掌握了扑克中最显著的特征:诈唬。
"在如何诈唬上存在有一个数学上的最优比率。电脑能够计算出来。如果人类诈唬太多,你就可以利用它们来赢钱。"
艾伯塔大滨的乔纳森·谢菲尔教授对《艾德蒙顿太阳报》如是说。
在2005年的世界扑克系列大赛期间,菲尔·雷克曾经单挑击败过当时世界上最好的扑克机器人。
2007-7-28 11:05 csdn2
在国际象棋等比赛中,比赛通常以相同的方式开局,并在一定规则下产生有限数量的走法。因此,计算机仅仅需要构建一幅树型图,用树的枝干代表下一步任何可供选择的走法,并从中挑出最有希望获胜的一种即可。
然而,扑克牌比赛因为存在更多不确定性,将导致无数种可能。例如,对手手中握有什么样的牌,他又将如何出牌等等。最重要的是,扑克牌比赛在很多情况下并没有所谓的“最佳走法”,因此树型图的对战方法对计算机参加扑克牌比赛并不适用。
除此之外,顶级扑克牌选手会在比赛中观察对手,并根据对方表现不断调整自己的策略。但设计人员却很难“赋予”计算机这种智慧。
尽管设计人员能够利用博弈论的相关理论弥补计算机的这些缺点,但该理论本身就存在“先天不足”。因此,如果希望计算机在“人机大战”中获胜,不但要使之具备博弈论中极强的计算能力,还要让它拥有观察对手并根据比赛情况随机应变的本领。
虽然计算机无法像人那样去观察对手的一举一动从而作出判断,但它却能记录下对手的比赛套路和方法,通过统计其出牌和不出牌的次数为比赛积累经验。美国马里兰大学计算机科学教授达纳·诺表示,尽早绘制出对手比赛套路是取胜的关键。
作者:英国《金融时报》专栏作家提姆•哈福德(Tim Harford) 2006年6月14日 星期三
2000年的拉斯维加斯世界扑克大赛(World Series of Poker)创纪录的吸引了500名选手前来参赛。在为期4天的比赛中,参赛者们逐渐被淘汰出局,直到剩下最后两名选手,在这场扑克牌中的顶级玩法——得州扑克玩法(Texas Hold ‘Em)大赛中进行巅峰对决。在这两名选手中,经验较为丰富的那位是个传奇人物:他叫T•J•克卢捷(T.J. Cloutier), 62岁,来自得克萨斯,是个职业赌徒,被很多许多人视为全世界最棒的扑克玩家。他的对手名叫克里斯•弗格森(Chris Ferguson),是一位37岁的计算机科学家,来自加利福尼亚,从1996年才开始参加这项大赛,而且所获得过的最好成绩不过是第四名。
弗格森可能相对是个新手,但却不容轻视。他有个绰号叫“耶稣”,因为他的脸深藏在浓密的络腮胡子和齐肩长发之后,而且还带着反光墨镜和一顶大号牛仔帽。
弗格森在比赛过程中从不说话,绝不表现出任何人类情感特征;他也没有过多注意其他选手因紧张而出现的面部痉挛,而是宁愿从牌面上获得他的全部信息。那个星期,他在拉斯维加斯一路过关斩将,带着10倍于对手的筹码进入决赛。
克卢捷是一位久经沙场的老手。他曾是一名专业橄榄球运动员,拥有一副宽厚的肩膀和一双大手,连扑克牌在他手中也显得很小巧,而他在牌桌上也格外引人注目。凭借出色的牌技和非凡的运气,克卢捷一点一点地消耗掉了弗格森在筹码上的领先优势。当他把弗格森引入危急境地时,他在筹码数量上仅落后一点点。他跟注时只增加了17.5万美元,就迫使弗格森追加至60万美元。而后,克卢捷把大约200万美元的筹码推进赌池——他全押上了。
弗格森开始犹豫,他计算着获胜的几率。克卢捷手中的牌可能比弗格森预想的更好。不管怎样,克卢捷这招很漂亮,如果弗格森这时不再跟注,将使他的对手遥遥领先。
另一方面,如果弗格森继续跟注而且获胜,那么,这场世界扑克大赛的胜利者就是他。他估计获胜的几率大概是1/3,而这实际上相当于胜利在望了。
在扑克游戏中,牌手们下注或跟注的目的是为了有权在每一手牌的最后进行“摊牌(showdown)”比大小。一个牌手如果不下注或跟注的话,就必须退出那一手牌的比赛。赌池中累积的所有筹码,构成了每次摊牌的输赢奖金。谁手中的五张牌最大,谁就赢走赌池中所有的钱。
大牌,比如“顺子”(五张牌连号)或者“葫芦”(三张同号牌加两张同号牌),最让人羡慕,但拿到那样的牌纯粹靠运气。赌博的技巧就在于下注和看懂其他选手的赌注。大赌注可能会吓跑那些没有意识到自己的牌其实最大的牌手,或者可能仅仅是确保你的“葫芦”获胜时,赌池中能有一大堆筹码。
在得州扑克玩法中,每位选手只拿2张牌。其它3张则从5张公用牌中挑选,与手中的牌进行组合。这5张公用牌分为几轮亮在牌桌上,以便增加几轮加注机会。在公用牌全部亮出之前,选手们只能猜想他们手中的2张底牌与那5张公用牌的匹配程度。大赌注往往出现在这一过程中,当然,决不会比克卢捷和弗格森的赌注更大了。
最后,经过几分钟的激烈思考后,弗格森摘下帽子和墨镜,突然缩了一下身体,暴露出他人性中疲惫和脆弱的一面——在一旁观战的作家詹姆士•麦克马纳斯(James McManus)在他描写这届比赛的小说《决胜河牌》(Positively Fifth Street)中写道:“他更像耶稣了。”(麦克马纳斯本人在此次大赛中被淘汰,排名第5。)之后,弗格森决定跟注。(译者注:在得州扑克中,亮出第5张公用牌的一轮叫做河牌,又叫第五街。)
克卢捷亮出了底牌,是一张A和一张Q,而弗格森是A和9。由于再也没有筹码可下注,5张公用牌以慢得令人窒息的速度被掀开。弗格森略微高估了自己的胜算:应该是1/4。他必须拿到一张9,才能和手中的牌凑成一对,而且还不能出现Q,让克卢捷凑成一对。当最后一张牌——9——出现在桌上时,弗格森立即意识到发生了什么,之后,鸦雀无声的人群才反应过来。他高举双臂,跳将起来,用瘦骨嶙峋的双臂给了克卢捷一个拥抱。克卢捷则平静地接受了失败。据麦克马纳斯在书中描述,这位大师当时说道: “这就是扑克。”
弗格森此后几年的征战纪录已经证明,当年出乎意料的结局并非侥幸。在历届世界扑克大赛决赛中,只有4个人赢的钱(相当于在高尔夫比赛中的晋级奖金)超过弗格森,而且在2000至2004年期间,弗格森赢得世界大赛的次数也超过了任何一位对手在10年里的夺冠次数。因此,这位“耶稣”有足够的理由被尊为21世纪最成功的选手,而他的胜利也超越了个人的范畴:人们长期以来试图将数学的严谨运用于扑克游戏心理较量,这次胜利标志着这一过程中一个转折点。
据报导,弗格森在比赛中赢取的奖金超过500万美元。在试图利用博弈论(数学的一个分支)来征战扑克牌桌的新一代选手中,他的表现最为出色。这是一场奇怪的竞争,是带着眼镜的数学怪才与冷漠赌徒的抗衡。但最奇怪的事情是,扑克中的确是有学问可做的。
上世纪20年代末,世界上最聪明的一个人决心研究出扑克牌游戏的正确玩法。后来曾主持计算机和原子弹开发工作的数学家约翰•冯•诺伊曼(John von Neumann),当时冒出了一个诱人的新想法:他希望将数学原理运用在社会科学领域,并且创造一种理论,分析种种事件的可能性,比如外交谈判破裂、敌对双方意外合作等,甚至是爆发核恐怖的可能。他认为,如果人们想要一种可以解释日常生活的理论,就必须从解释扑克游戏的理论开始——即博弈论。他表示:“现实生活中充满了虚张声势和迷惑他人的小把戏,而且人们也经常揣摩其他人如何考虑自己的意图。这就是我的理论所研究的博弈。”
对于数学家来说,研究虚张声势、骗人诡计和心理揣测等问题都是没有前途的。不过,如果有人适合对此进行研究的话,那么他就是冯•诺伊曼。为他撰写传记的威廉•庞德斯通(William Poundstone)表示,冯•诺伊曼那值得夸耀的计算本领众所周知。二战之后,冯•诺伊曼在普林斯顿大学(Princeton)工作,而他的能力甚至可能超过了其同校同事爱因斯坦(Albert Einstein)。他帮助设计了全球计算速度最快的计算机,之后又证明了他的计算速度比这台计算机还快。没有人对此表示惊讶。他的同事们开玩笑说,他是个在深入研究过人类之后能惟妙惟肖地模仿人类的“半仙”。
为了研究扑克游戏,冯•诺伊曼必须开创新天地。长期以来,人们一直利用概率理论分析运气游戏(games of chance)的取胜几率。而象棋等具有严格逻辑性的游戏需要非凡的计算能力。但扑克则完全是另一种游戏。
扑克游戏的多数重要信息都是隐藏的;每个玩家只能看到其中的一部分,他们必须通过观察其他玩家的行为,把各种信息拼在一起,获得更多信息。由于赢家通吃,因此,赌注越大,失败的代价也就越大。然而,在许多牌局中,尤其是在两个技术高超的玩家之间,不会出现摊牌的时刻:一个玩家大笔加注,足以吓退其他玩家。总之,玩家下注的多少与他持有的牌的好坏之间没有直接联系。
扑克中的虚张声势引起了冯•诺伊曼的兴趣。菜鸟们错误的认为,虚张声势仅仅是一种用坏牌赢得所有奖金的途径。在1972年世界扑克大赛的决赛中,著名赌客阿玛里洛•斯利姆(Amarillo Slim)赢得了比赛,因为他在比赛中屡屡使用虚张声势的手法,而当他最后持有一手“葫芦”(非常大的牌),把所有筹码全押上的时候,他的对手认为他又在虚张声势,因此选择跟进,最后输掉。从不使用这种手法的玩家永远不会赢得大额奖金,因为在他非同寻常地选择加注的情况下,其他人会放弃,不会跟进下大赌注。
还有另一种虚张声势的技巧:当你手中有好牌时,假装牌不好。在1988年的世界扑克大赛中,中国出生的Johnny Chan(绰号“东方快车”(Orient Express),因为他赢钱的速度极快)放弃了所有加注的机会,不声不响地跟注。在最后一圈下注时,他的对手相信Johnny Chan没有好牌,因此把所有的筹码全部押上。Johnny Chan随即跟牌,最后亮出了一个“顺子”(好牌),赢得了70万美元奖金,并摘取了世界冠军的头衔。
这些故事似乎都关于心理学,而非数学。尽管Johnny Chan和斯利姆都对计算几率以外的数学知识毫无兴趣,但冯•诺伊曼的理论可以解释他们所做的一切。在1944年出版的、与经济学家奥斯卡•摩根斯坦(Oskar Morgenstern)合著的开创性著作《博弈论与经济行为》(A Theory of Games and Economic Behavior)中,冯•诺伊曼表示,你只能在牌很差的时候虚张声势,手中的牌差强人意的时候不要使用。
理由很简单。一把普通大小的牌可能打败另一把普通大小的牌,因此值得你勉力坚持到最后,进行低赌注的摊牌。一把烂牌只有在对手盖牌放弃时才能胜出,因此,拿到一手烂牌,要么强势出击,要么彻底放弃;事实上,最出色的玩家在大张旗鼓下注时,他们手中的牌通常奇烂无比。冯•诺伊曼的模型还凸显了虚张声势的另一好处:它迫使对手频繁跟注,因此,一把好牌会赚得更多。
冯•诺伊曼的书红极一时,但学者们很快醒悟过来:他们发现博弈论的局限性太大,很难应用于现实世界。虽然有少量图书“被职业赌徒买走”——正如普林斯顿大学出版社(Princeton University Press)在1949年窘迫地表示,但这本书的销量并不好。
直到上世纪80年代晚期 ,扑克游戏对数学家而言才开始变得安全一些,这时一些大型娱乐公司迁至拉斯维加斯,开始提供一些文明方式的让人把钱掏出来。这些数学怪才很受欢迎,但他们依旧很难将博弈论转变为牌桌上的胜利。
冯•诺伊曼1957年去世。在他去世之后的很多年里,学者们也在苦苦思索,如何将博弈论运用在经济、生物及军事战略等现实生活中的问题上。其中一个主要困难在于,人类智力是完全不可靠的。有关冯•诺伊曼是“半仙”的玩笑非常贴切:他在设计其“零和游戏”模型的时候,设想的是两位与他本人同样聪明的“半仙”对阵。但我们不能总是假定一定能遇上优秀对手:当你对手的聪明程度并不足以运用精明的战略时,提防这些策略是没有任何意义的。
这一问题在扑克游戏上尤其突出。面对可能过多或过少虚张声势的弱手时,在面对实力较弱的对手时,一套在理论上无懈可击的扑克策略可能会错过战胜他的大好机会,因为这样的对手可能过度虚张声势或极少这么做。过度虚张声势的情况下需要采取保守策略诱使他犯错,而在后一情况下要让对手犯错则需咄咄逼人一些。但博弈论的假设前提是,这种情况不会发生。
应用博弈论的另一个困难是,扑克游戏颇为复杂,即便是运算速度最快的计算机,也无法找出最佳解决方案。如果某位玩家一秒钟可以思考10种可能性,那他可能不得不在银河系诞生的那一刻,就开始为两位德州扑克玩家计算出一个合乎博弈论的解决方案。
一个希望运用冯•诺伊曼理论的真正扑克玩家,在某种程度上可能必须具备超越这位大师本人的运算能力。或者,他可能不得不找出捷径,在不严重影响其推测质量的前提下,简化这一数学问题。他还必须认识到,在对手的牌技很糟糕时,有必要把博弈论策略搁在一边。这时需要采取非常手段。
1988年,刚刚兴起的互联网开始作出响应。当时,网上出现了一种新现象:互联网中继聊天扑克游戏(IRC Poker)。这是一种简单程序,使用名为“互联网中继聊天”(internet relay chat,当今在线聊天室的前身)的程序来发牌,主持互联网玩家之间的扑克游戏。这种游戏并不涉及金钱输赢,只不过是玩家们可以有机会击败世界上最厉害的数学怪才们。
克里斯•弗格森很快成为这一小群人中的佼佼者。作为加州大学(University of California) 洛杉矶分校计算机科学专业的一位博士研究生,弗格森当时正研究人工智能,利用博弈论帮助电脑玩棋盘游戏。他在早年就接触到了扑克游戏和博弈论。他的家人都是疯狂的游戏玩家,他的父亲是一位数学教授,在加州大学洛杉矶分校教授博弈论。周末时,年轻的弗格森会驱车到拉斯维加斯,与其他游客玩非常保守的扑克游戏,用赢来的钱支付酒店账单。但对于一个希望深入研究这种游戏的人来说,互联网中继聊天扑克游戏是个更好的实验室。里面有原始数据供他分析,其中充满着激烈的竞争,让他着迷。
弗格森开始利用博弈论研究,在拿到什么牌的情况下可以虚张声势,虚张声势的使用频率,以及在拿到一手好牌的情况下,如何在加注太少和加注太多、吓退对手之间的寻找平衡。他记住了他所玩的每场牌局的结果。他的方法与冯•诺伊曼一样,但在强大电脑的帮助下,他能够比这位前辈分析更为实际的扑克游戏。
很快,弗格森开始得出一些出人意料的结论。他指出,老派扑克专家在拿到好牌时加注太多。他们加注很多,目的是希望在牌面仍然领先时赢得赌池中的奖金,但弗格森指出,这时加注可以少些,鼓励对手抱着牌面改观的希望跟进加注。有时,那些对手会很幸运,但总的来说,有好牌的玩家将在加注较少的情况下赢得更多的钱。
“我向一些倍受尊敬的扑克玩家展示了我的大量研究,”弗格森告诉我,“他们对此嗤之以鼻,但我认为,这是因为他们对此不了解,所以不同意我的研究结果。但我知道我是对的,而这种分歧表明,数学可以击败全世界最优秀的玩家。”
自信是弗格森的个性:他知道,博弈论会带给他优势,不是因为他在赌桌上的佳绩,而是因为这个理论是正确的。当他在2000年击败T•J•克卢捷时,几乎无人怀疑弗格森对扑克游戏有着深刻的洞察力。
到2005年,世界扑克大赛的规模已经超出了老旧的比尼恩马蹄铁赌场的接纳能力,比赛移至拉斯维加斯大道(Las Vegas Strip)附近的里奥酒店(Rio Hotel)。巨型大厅里摆放着数百张牌桌,6000名选手摆弄着他们陶土筹码,众多筹码相互碰击发出的清脆声音,犹如大厅里藏着一群疯狂的蟋蟀。
与需要支付1万美元入场费的场内比赛相比,很多人注册参加了在网上进行的比赛——人数最多的时候,全球有逾10万名玩家同时在网上玩扑克赌钱,远非互联网中继聊天时代所能企及。电视直播的扑克游戏满足了人们的需求,而人们的需求也推动了电视直播的火爆。在电视台开始安装摄像头,拍下每位玩家的底牌之后,这种全世界最不吸引观众的运动,变成了一种引人入胜的比赛,同时弗格森等玩家也变成了巨星。当我和他走在里奥酒店的赌场时,每隔几秒钟就有人找他合影或签名。而他每次都以老练的优雅态度作出回应。他承认:“我喜欢这样。”
扑克游戏步入新时代,所有人都可以参加,意味着有头脑的玩家已经有了追随弗格森的勇气。耶鲁大学(Yale)数学家、扑克书籍作家马特•马特罗斯(Matt Matros)表示:“如果只有酒吧里的不法之徒玩扑克的话,那你就不会在这看到这些医生和律师了。”马特罗斯已在比赛中赢得了逾75万美元。他确信,在最高水平的扑克游戏中,博弈论将成为必备武器。麻省理工学院(MIT)毕业生、博弈理论家安迪•布洛赫(Andy Bloch)持同样观点。也曾获得过扑克比赛冠军的布洛赫认为,双人版德州扑克的博弈问题不久将得到解决,意味着牌桌上的每一个决定都将有一个确定的正确答案。
在与扑克高手进行双人对决时,通晓博弈论的玩家无疑具有最大的优势。弗格森在两届新的双人淘汰制全明星扑克大赛中均闯入决赛,并在其间击败了克卢捷。如果布洛赫和马特罗斯是正确的,那么每一位认真的玩家将自然不得不学习双人扑克的招数,就像象棋选手要记住几十种不同开局套路一样。
但在多数情况下,扑克游戏不是双人对决,而且多数玩家参加的牌局也远远不是冯•诺伊曼假设的理想牌局。多数扑克新手不是数学专家,但却贪得无厌的希望赢很多钱。“如果你想通过打扑克赚钱,那你做这件事的理由就错了,”弗格森表示,“你必须喜爱这种游戏,而且你必须愿意付出努力。”
弗格森知道,大量新手的参与,打破了博弈论有关高手对决的假设。其他一些顶级专业人士认为,这将会一直限制该理论的用武之地.
肩膀宽厚、身高超过6英尺的霍华德•莱德勒(Howard Lederer),因其在比赛时喜欢深思熟虑而被赋予了“教授”的绰号。当我在里奥酒店拖住他进行交谈时,他告诉我,低手太多,使得博弈论无法成为扑克高手的主要武器。“只有在与另一个行家进行对抗的情况下,才能完全依靠博弈论。这种情况极其少见。一般情况下,打扑克主要靠心理学。你需要懂一些博弈论,但心理学的作用更大:当人们心理比较脆弱的时刻控制住他们,左右他们的心理。”
如果莱德勒是正确的,那么大量新手的参与正破坏着博弈论的用途。博弈论告诉你如何避免在高手面前输局,而不是如何击败实力较弱的对手。参加比赛的“鱼腩”越多,博弈论的用武之地就越少。因此,冯•诺伊曼的理论遗产或许只能指望非同寻常的新一代玩家来继承了。
让我们回到比尼恩马蹄铁赌场。这里距离里奥酒店很近,乘坐出租车只要片刻时间。在2005年世界扑克大赛举行期间,另外一个锦标赛在这里上演。这里的场面更像个网吧而不是赌场,绿色的台面被纵横交错的电缆所取代,6台电脑彼此相对,一分钟之内,看不到发牌猜牌、下注跟注、摊牌收筹码,就已经进行了数十局斗牌,而这些扑克牌和筹码只存在于电脑空间之中。
当比尼恩马蹄铁赌场1970年主办世界扑克大赛时,只有受到邀请的人才能参加比赛;几场比赛之后,所有人投票将世界冠军的头衔授予了经验丰富的约翰尼•莫斯(Johnny Moss)。2005年的首届世界机器人扑克大赛(World Poker Robot championship)重拾了这个传统。这里的6个软件程序都是应邀参加比赛的,而真正的冠军勿庸置疑:艾伯塔大学(University of Alberta)游戏程序研究组——7年来,它击败了所有电子对手,现在他们受邀担任比赛裁判,而不是参赛选手。
艾伯塔代表队的达尔斯•比林斯(Darse Billings)和我在附近一张桌子坐了下来。他是队中最厉害的扑克玩家,也是一个博弈理论家,很乐意与一个对约翰•冯•诺伊曼有所耳闻的人聊天。比林斯有一张圆圆笑脸,长着短短的、毛茸茸的胡子,有点像玩具熊,但他声称,他在输牌的时候可不那么惹人喜爱。他说:“我曾是互联网中继聊天扑克游戏的绝顶高手。”言语之中流露着骄傲。后来怎么了?“克里斯•弗格森开始玩牌,并且超越了我。”
比林斯和同事们还没制造出能够打败弗格森的软件。弗格森被视为一个特别的挑战,因为他不会因为对手是一个没有任何肢体暗示的机器而受到干扰。但他们对挑战一个拥有人工智能和博弈论博士学位头衔的世界冠军很感兴趣。但是,在目前,几乎任何一位顶级人类玩家都能战胜电脑。在世界机器人扑克大赛结束后进行的两场表演赛中,知名扑克玩家、绰号“隐形炸弹手”的菲尔•拉克(Phil Laak)参加了与机器人的比赛。狂热的支持者高喊着“人类加油!人类加油!”,他很快地战胜了艾伯塔的程序和一个名为PokerPro的新科状元。没人对此感到惊讶。
在扑克游戏中,人工智能研究人员目前面临的挑战与冯•诺伊曼在大约80年前所遇到的挑战一样,即如何理解那些骗人的诡计。目前,冯•诺伊曼的博弈论仍是最成功的招数,这一点得到了强大的计算机程序SparBot的证实——它击败了大多数登陆艾伯塔网站想要一试身手的人。比林斯预言:“我相信电脑最终将会比所有人类都玩得更好。”弗格森对此表示赞同:“如果用在扑克机器人方面的资源达到象棋机器人的十分之一,那么它们早就打败我们了。”
在互联网中继聊天扑克游戏时代,网络扑克游戏倾注了创建者们无穷的热情,而许多评论人士现在担心,今后它将毁于扑克机器人之手。网上扑克游戏每天的赌金估计超过2.5亿美元——这无疑是一个巨大的诱惑,刺激人们编写一个软件程序来捕猎全球各地毫无戒备之心的“鱼腩”。通过玩网络扑克游戏,一位出色的玩家一个月能挣数千美元,那么,如果这个玩家被无数居心不良的电脑程序所取代,情况会怎样?
比林斯确信,这种情况在短期内发生的风险被夸大了。他自己的SparBot是一个学术项目,不是为了钱而玩扑克的;同时他对其它程序不屑一顾,就是因为它们还不够好。“与电脑带来的威胁相比,对电脑的恐惧是个更大的问题。在互联网上有几十个扑克机器人,但它们都在赔钱。”但他承认,人们迟早能够下载一个能战胜世界冠军的免费电脑扑克软件。就这一点而言,人们可能无需担心会与一个身分不明的对手在网上赌钱。
一个颇具讽刺意味的结局却越来越有可能成为现实:最终,网上扑克游戏将被那些能够掌握约翰•冯•诺伊曼博弈论的扑克玩家所主宰,那就是电脑。同时,人类将回到有血有肉的赌场世界,在那里,一个因紧张而出现的面部痉挛能比一千次计算告诉你更多。像弗格森这样的人类电脑已经创造出一个新的行当,但只要牌桌上有“鱼腩”,“哈巴狗”皮尔森和玛里洛•斯利姆那种古老的技巧就不会消失。研究扑克游戏的数学家留下的最大遗产,不是颠覆传统的扑克游戏,而可能是将这种游戏变得对我们其它人而言比以前更有趣。
德州扑克人机大战
“第一届人类对机器扑克锦标赛”,组织方为此提供了5万美金奖,资深职业牌手最终战胜了阿尔贝塔大学一个人工智能研究团队开发的电脑程序,而双方在赛后强调,这次比赛纯粹是为了科研需要,绝非为赌博者提供福音。 一般的公认是扑克要比下国际象棋或者西洋跳棋难,因为打扑克牌更要求在讯息不完整的情况下根据预判(或者说,运气和赌博心理)进行,这就阻止了电脑的计算能力像下棋那样充分发挥,因此设计扑克牌程序也比下棋程序要困难得多。科学家必须开发更多不同的策略和技巧,来应付层出不穷难以预计的牌手计谋,但如何识别人类会采用的虚张声势等冒险行径,对于电脑程序而言还是个难点。
过去科学家的研究集中在象棋和跳棋上,1997年,超级计算机“深蓝”战胜世界棋王卡斯帕洛夫堪称“电脑压过人脑”的里程碑,阿尔贝塔大学的研究人员们早在1994年就研究出可以战胜世界级棋手的程序,而本月早些时候他们宣布,升级过的象棋程序“永不会输”,完全先进于任何人类棋手。
该大学对于扑克牌程序的研究则始于16年前,但进展却始终没有像象棋程序那么有效,“扑克牌程序的研究更要求在实战中进行。”阿尔贝塔大学计算机科学部主任沙弗尔表示,“扑克牌是一种我们成为不平等讯息的游戏,你不知道对手的牌,这就要求你必须处理的是各种可能性。”
沙弗尔认为,随着这套扑克牌程序的不断完善,未来也将对股票程序的开发和优化大有帮助,因为两者都是建立在部分讯息的基础上分析和预判各种可能性,“这个类型的程序也许不能帮你更好地赌博,但它能帮你投资……或者消费。”
菲尔·拉克和阿里·伊斯拉米,两位排名世界顶尖的洛杉矶扑克牌手,在本周惊险战胜一个名为“Polaris”的电脑程序后证明:玩扑克,人脑还是比电脑行。
这项比赛采用的是得克萨斯纸牌(一种在拉斯维加斯风行的扑克游戏,后被开发为一个电脑游戏),于本周一在加拿大温哥华一家宾馆会议室开战,比赛场面非常奇怪——一边是疲惫不堪的两位职业牌手,一边是疲惫不堪的一排计算机科学家,再加上一大帮同样疲惫不堪的观众,这场马拉松大战直到当地时间周二深夜11点才结束,拉克和伊斯拉米凭借第四局和最后一局的微弱点数优势胜出。
不同于象棋比赛,扑克大赛不需要极端的注意力集中和长时间的安静,因此比赛过程更像是个节日,数百名观众,而当人类最终赢得这场比赛后,闷热不堪的会议室里爆发出阵阵欢呼。
“我很高兴比赛终于结束了。”30岁的伊斯拉米赛后承认,和电脑的比赛比他职业生涯的此前任何一场都要绞尽脑汁,“一上来电脑打击我时就像打个鼓一样容易。”曾当过电脑咨询员的伊斯拉米则盛赞了这个程序以及计算机科学家们,“我们居然赢了,太意外了……电脑现在已经如此先进,未来将越来越难战胜它。”不过科学家们质疑道,鉴于牌手的计算机专业背景,他们要比其他顶尖高手能更有效地对付程序。
随着这次人机大战,科学家们将进一步优化这个程序,因此在开战前就被普遍认为是人类在扑克牌比赛中最后一次战胜电脑的机会。在这场整整持续了两天的比赛的前三局,人类和电脑各是一平一胜,因此第四局最后几分钟至关重要,结果人类在这微妙的时刻占了上风,用计算机科学家、比赛裁判迈克尔·李特曼的话来讲,拉克和伊斯拉米是“显而易见的赢家。”
“整件事情最精妙的地方在于,我们赢了,但没有以巨大的优势胜出,电脑只是差了一点儿,那就是真实的差距所在。”拉克说,“这就好比你要在一项比赛里战胜500个人一样。”为了确保比赛的公正性,两名牌手和电脑对战时都使用了完全相同的牌局,而和真人对局另外一个大不同的地方是,电脑绝对不会察言观色,职业高手们真假难辨的表情、动作无从诱导他们的对手,这是电脑牌手的优点,但从另一方面来讲,也让打牌丧失了最有趣的一部分。
2007-7-28 09:56 csdn2
在德州扑克中到底是电脑厉害,还是人脑厉害呢?
艾伯塔大学的开发人员认为,如果他们的电脑程序"北极星"与专业玩家菲尔·雷克和阿里·伊斯拉姆对战2000手德克萨斯扑克的话,"北极星"将表现出色,为此他们设下5万美元的赌局。
这种事情在象棋比赛和巴加门15子棋比赛中已经发生过:最终电脑都战胜了人类。
扑克是更加复杂的运动,而且至今不能被冷冰冰的机器所掌握,但艾伯塔大学的研究员们愿意接受这个挑战。
菲尔·雷克与阿里·伊斯拉姆将在7.23和7.24日于温哥华举行的人工智能发展协会的年会上进行挑战。比赛分为4次,每次500手。
实验将尽可能地模拟扑克与生俱来的随机性。在每次比赛的终了,将人类的资金总和机器的资金总和比较以决出胜负。
"北极星"实际上是由多个执行不同功能的电脑程序相互协作的。其中一个玩得非常凶,但并不十分留意对手的玩牌风格。另外一个则会分析对手的强弱从而相应地调整玩法。
不过,所有的程序都掌握了扑克中最显著的特征:诈唬。
"在如何诈唬上存在有一个数学上的最优比率。电脑能够计算出来。如果人类诈唬太多,你就可以利用它们来赢钱。"
艾伯塔大滨的乔纳森·谢菲尔教授对《艾德蒙顿太阳报》如是说。
在2005年的世界扑克系列大赛期间,菲尔·雷克曾经单挑击败过当时世界上最好的扑克机器人。
2007-7-28 11:05 csdn2
在国际象棋等比赛中,比赛通常以相同的方式开局,并在一定规则下产生有限数量的走法。因此,计算机仅仅需要构建一幅树型图,用树的枝干代表下一步任何可供选择的走法,并从中挑出最有希望获胜的一种即可。
然而,扑克牌比赛因为存在更多不确定性,将导致无数种可能。例如,对手手中握有什么样的牌,他又将如何出牌等等。最重要的是,扑克牌比赛在很多情况下并没有所谓的“最佳走法”,因此树型图的对战方法对计算机参加扑克牌比赛并不适用。
除此之外,顶级扑克牌选手会在比赛中观察对手,并根据对方表现不断调整自己的策略。但设计人员却很难“赋予”计算机这种智慧。
尽管设计人员能够利用博弈论的相关理论弥补计算机的这些缺点,但该理论本身就存在“先天不足”。因此,如果希望计算机在“人机大战”中获胜,不但要使之具备博弈论中极强的计算能力,还要让它拥有观察对手并根据比赛情况随机应变的本领。
虽然计算机无法像人那样去观察对手的一举一动从而作出判断,但它却能记录下对手的比赛套路和方法,通过统计其出牌和不出牌的次数为比赛积累经验。美国马里兰大学计算机科学教授达纳·诺表示,尽早绘制出对手比赛套路是取胜的关键。