事实如此浪漫

电脑在扑克游戏中打败了人类。接下来:其他的一切?

只是一个人:Libratus在扑克游戏中的成功是人工智能战胜创造它的物种的又一次胜利。 由arsenik拍摄/格蒂

O在今年早些时候的20天时间里,人工智能遇到了如何解决现实世界问题的重大考验。一个叫做Libratus的程序在在里弗斯赌场举行的锦标赛在宾夕法尼亚州的匹兹堡。他们玩的是一种叫做“人头无限德州扑克”(heads-up no-limit Texas hold ' em)的扑克游戏,通常是两名玩家在网上展开一长轮较量,测试对方的策略,完善自己的策略,疯狂地虚张声势。12万张牌后,Libratus以压倒性的优势战胜了所有四个对手,赢得了1776250美元的模拟奖金,更重要的是,赢得了号称地球上最好的扑克玩家的吹嘘权利。在比赛进行到一半时,在机器面前表现最好的人类选手金东(Dong Kim)几乎承认失败。“直到今天我才意识到它有多好。我觉得我是在和一个作弊的人下棋,好像他能看到我的牌。告诉《连线》杂志.“我不是在指责它作弊。它就是那么好。”

Libratus的成功是人工智能战胜创造它的物种的又一次胜利。当计算机掌握了相对简单的井字游戏和跳棋游戏时,除了计算机科学家外,没有人会太在意。但在1997年,当ibm的“深蓝”(Deep Blue)在天才们毕生致力于的国际象棋比赛中击败国际象棋大师加里·卡斯帕罗夫(Garry Kasparov)时,人们对电脑将变得多智能产生了兴趣和担忧。最近,人工智能的进步越来越快:2011年,ibm的沃森(Watson)超越了最伟大的(人类)智能机器人。冒险!就在去年,一个名为AlphaGo的程序打败了世界上最好的围棋选手之一李世石十年之前许多研究人员预期智人让我们失去对那出了名的复杂游戏的控制

Libratus给了我们诱人的想法,计算机处理复杂和重要的问题比我们更好。

扑克似乎只是人工智能前进的又一步(如果你相信科幻小说的话,它会朝着反乌托邦的全球主导地位的方向前进),但它可能是最重要的一步。不像其他游戏,扑克是一种不完全信息游戏.在国际象棋和围棋中,你知道自己和对手的棋子在哪里,然后从这个明确的位置向前投射;在扑克游戏中,你不知道对手的牌是正面朝下的,你必须在这种不确定的漩涡中做出决定。研究人员表示,这更困难,也更重要,因为很多重要的决定都是基于不完整的信息。医生观察病人,收集他们所能收集的证据,然后做出生死抉择,通常并不知道病人体内到底发生了什么。外交官、商务谈判人员和军事战略家不知道他们的对手的真实立场或意图,必须根据可能的行动和结果的复杂网络制定战略。

对人工智能研究人员来说,扑克程序不仅仅是赢得纸牌游戏的更好方式:它们是一种实验,旨在了解计算机在信息不完善的情况下如何做出决策。几十年来,他们一直在努力改进自己的项目,以匹配当前的基准:我们。卡耐基梅隆大学(Carnegie Mellon University)的计算机科学家、Libratus的创始人图马斯·桑德霍尔姆(Tuomas Sandholm)已经玩扑克12年了。他之前创造的克劳迪科在2015年的一场类似的比赛中输给了四名职业扑克选手。阿尔伯塔大学(University of Alberta)的一个团队最近宣布,他们的名为DeepStack的项目是第一个被击败职业选手在无上限的德州扑克比赛中获胜,不过参加赌场锦标赛的人说,竞争没有那么激烈。既然计算机已经证明了它们比人类玩扑克玩得更好,它们可能已经准备好利用这一技能来做出比我们更好的现实世界决策。

创建一个聪明到足以获胜的程序需要一个聪明的方法;桑德霍尔姆依靠一种叫做强化学习的技术。他和他的学生们教给Libratus游戏规则,并给它一个简单的目标,那就是赢钱,然后让它用数万亿的手来对付自己,尝试它碰到的任何招数。这个程序观察什么有效,什么无效,然后使用这些观察来制定自己的战略。这样做的一个明显优势是,Libratus并不局限于其他扑克玩家开发的策略,有时它还会想出自己的、违反直觉的动作。例如,当Libratus持有弱牌而对手提高赌注时,程序有时会立即提高赌注。这似乎有些鲁莽,因为这增加了弱牌输给强势牌对手的几率。“如果我10岁的女儿做出这种举动,我会教她不要这样做,”桑德霍尔姆告诉华盛顿邮报》.“但事实证明,这实际上是一个很好的举动。它有助于抓住虚张声势。”也就是说,如果下注的对手是在虚张声势,他们可能会被Libratus的反注吓到,认为程序有很强的优势,然后就会认输。Libratus发现可以用更大的虚张声势来战胜虚张声势。

人工智能领域最近取得的许多著名进展,如自动驾驶汽车、面部识别和自然语言处理,都依赖于另一种被称为机器学习的方法,即计算机研究庞大的数据集,并从它们看到的模式中得出结论。相反,强化学习可能更善于让电脑产生自己的创造性策略。如果这是真的,那么Libratus和AlphaGo都使用强化学习来发展它们超越人类的技能就不是巧合了。

Libratus让我们想到计算机处理复杂和重要问题的能力比我们以往任何时候都强,但这项技术发展得如此之快,以至于它何时、如何或是否会成功应用尚不清楚。在短期内,该项目本身甚至不会对其自然栖息地构成太大威胁。Libratus在一次只对一个对手的扑克游戏中占主导地位;如果移动到一张满是玩家的桌子上,计算就会更加复杂,Libratus就会超出它的深度。即使在一对一的在线游戏中,Libratus对计算的要求也非常高(它运行在这是一台超级计算机,其处理能力是高端笔记本电脑的7000倍,内存是高端笔记本电脑的17000倍),在研究之外使用它是不切实际的。目前,该程序正在以一种不同的方式改变扑克世界——通过训练人类玩家。“我们确实在从这台电脑的思维方式中学习,”杰森·莱斯,被机器打败的球员之一。“我想我会成为一个更好的扑克玩家。”

阿莫斯·泽伯格(Amos Zeeberg)是驻东京的自由科技记者。

得到了鹦鹉螺必威开户官网

最新和最受欢迎的文章投递到您的收件箱!


看:肯·戈德堡是加州大学伯克利分校自动化科学实验室的机器人专家,他讲述了机器人所做过的最具创造性的事情。

加入讨论