简历阅读- - -为什么深蓝国际象棋电脑能像人类一样玩

关闭

你已经阅读了每月两篇免费文章中的一篇。学习更多的知识。

关闭

为什么深蓝国际象棋电脑能像人类一样玩

随机性可能是人类和计算机创造力的关键。

1997年,当IBM的深蓝在一场六局的国际象棋比赛中击败国际象棋大师卡斯帕罗夫时,卡斯帕罗夫开始相信他面对的是

W当IBM的“深蓝”在1997年的一场六局象棋比赛中击败国际象棋大师加里·卡斯帕罗夫时,卡斯帕罗夫开始相信他面对的是一台能够体验人类直觉的机器。卡斯帕罗夫在赛后写道:“机器拒绝移动到一个具有决定性短期优势的位置。”它“表现出一种非常人性的危险意识”。1在卡斯帕罗夫看来,深蓝似乎是在体验游戏,而不仅仅是在处理数字。

就在几年前,卡斯帕罗夫还宣称:“没有电脑能打败我。”2当一个人最终这么做的时候,他的反应不仅是认为电脑比他更聪明,而且也变得更像人类了。对卡斯帕罗夫来说,下棋有一种独特的人类成分,是计算机无法模拟的。

卡斯帕罗夫在“深蓝”中并没有感受到真正的人类直觉;在IBM工程师团队不断观察和管理的代码中,没有任何类似的东西人类的思维过程.但如果不是这样,那又会怎样呢?答案可能会从另一组游戏开始,这些游戏的名字看起来不太像:Go、Hex、Havannah和Twixt。所有这些都有一个相似的设计:两名玩家轮流在一个相当大的棋盘(围棋是19乘19,Twixt是24乘24)的剩余空间上放置棋子。我们的目标是达到某种获胜的配置,比如在围棋中包围大部分领土,在Hex中连接棋盘的两个相反的边,等等。

卡斯帕罗夫可能真的在深蓝的游戏中发现了类比思维的暗示,并误以为是人为干预吗?

计算机下棋的通常方法是单独考虑各种走法的可能性,评估结果,并对走法进行排序。但是对于像《围棋》和《Twixt》这样的游戏来说,这种方法就行不通了。在国际象棋中,任何时候都有最多几十种可能的走法,而这些游戏却提供了数百种可能的走法(游戏邦注:《Arimaa》的走法是数千种,它被设计成一种类似国际象棋的游戏,电脑无法打败它)。对所有或最可能的棋盘位置进行超过几步的快速评估,对于计算机来说,在合理的时间内进行分析是不可能的:组合爆炸。此外,即使是评估的概念也比在国际象棋中更难,因为在如何判断特定棋盘配置的价值上存在较少的共识。

沉思:加里·卡斯帕罗夫(Garry Kasparov)在与“深蓝”的第六场也是最后一场比赛开始时如是说。他会继续输下去。 斯坦本田/法新社/盖蒂图片社

但对于人类来说,这些游戏仍然具有很强的可玩性。为什么?计算机科学家、高级围棋选手Martin Müller给了我们一个提示:

人类识别的模式不仅仅是大块石头和空间:玩家可以感知石头组之间的复杂关系,并容易掌握“轻”和“重”石头等模糊概念。游戏的这种视觉特性符合人类的感知,但很难在程序中建模。3.

换句话说,围棋策略不在于对游戏的严格形式化表示,而在于各种不同的视觉模式识别和相似性分析:将碎片分类成不同的形状和块,将它们与相同或视觉上相似的模式进行比较,并迅速将研究空间缩小到可管理的水平。卡斯帕罗夫可能真的在深蓝的游戏中发现了类比思维的暗示,并误以为是人为干预吗?


一个在思考思考方面,叙述者有着悠久的历史。

认知语言学家,如马克·特纳和吉尔斯·福康涅,根据乔治·拉科夫(我们赖以生存的隐喻),强调概念“混合”的类比过程是人类认知的各个层面的核心,从识别图像到创造性写作,再到将数学概念应用于世界。4,5历史学家和哲学家阿瑟·i·米勒(天才的洞察力6和历史学家安德鲁·罗宾逊都强调创造性,概念性的类比是科学创新和革命的核心。

但是,类比对计算机,甚至对构成计算机科学基础的形式逻辑,都是一个重大挑战。数学家斯坦尼斯拉夫·乌兰(Stanislaw Ulam)认为类比是将形式逻辑扩展到涵盖整个世界的关键:“当你看到时,你看到的是什么?”你把一个物体看成一把钥匙,你把一个人看成一名乘客,你把一些纸看成一本书。‘as’这个词必须在数学上正式化,与‘and’、‘or’、‘implies’和‘not’等连接词同等重要……”7

众所周知,计算机在推理类比关系方面表现得很差,比如认为一匹马的图片描绘了一个叫做“马”的物体类别的实例。当人们看马的时候,我们不是一点一点地看它,然后分析它;我们马上就能看到它作为马(或汽车,或飞机,或其他任何东西)的类比——即使是在高度可变性的情况下。

这是一个没有策略的元策略!

曾在道格拉斯·霍夫施塔特(Douglas Hofstadter)麾下学习的计算机科学家和复杂性理论家梅勒妮·米切尔(Melanie Mitchell)研究了计算机如何借助形状原型对物体进行分类。这些实验使用神经网络和“学习形状”字典来匹配新的形状。在2013年的一项研究中,米切尔有了一个惊人的发现:如果算法的字典被移除,并用一系列随机形状投影进行匹配,算法的表现同样出色。8虽然直觉可能表明大脑建立了与世界上的物体相对应的表征原型,但米切尔的研究表明,纯粹的随机性可能在概念化过程中发挥了重要作用。

这些结果在多大程度上与人类相似尚不清楚。但它们开启了一种可能性,即我们进行类比的过程可能比我们想象的更不理性、更随机,我们大脑中匹配的深层原型与现实的关系可能比我们想象的要小得多。在我们看似理性的背后,可能是神经生物学过程,看起来更像是随机试验和错误。在这种观点下,人类的创造力和随机性是密切相关的。

随机性的力量在新方法中充分体现出来,最终使电脑能够以专业水平玩围棋、Hex、Havannah和Twixt等游戏。9这些方法的核心是一种被称为蒙特卡罗方法的算法,正如它的名字一样,它依赖于随机的统计抽样,而不是对每一步可能的棋牌配置进行评估。例如,对于一个给定的移动,蒙特卡罗树搜索将从该移动中进行一些随机或启发式选择的未来游戏(“玩法”),任何玩家的移动背后都没有什么策略。大多数可能性都没有发挥出来,因此限制了大量分支因素。如果不管采用何种策略,一招往往能带来更多胜利,那么这招就被认为是更强的一招。其想法是,这样的抽样通常足以估计一个动作的总体强弱。

如果有什么不同的话,蒙特卡罗方法似乎仍然比计算机象棋方法更愚蠢,因为现在计算机不再评估棋盘位置,而是随机(或至少部分随机)玩游戏,并抽样可能性。这是一个没有策略的元策略!但是蒙特卡罗方法更适合于高分支游戏,而不是试图对特定棋盘位置的力量进行精确评估的“战略性”方法。

卡斯帕罗夫在演奏深蓝时可能会感觉到的是出现比如那种创造性的随机性,他认为这是“人类”对危险的直觉。深蓝程序员徐凤雄在他的书中写道在深蓝在比赛期间,外界分析人士对该节目的神秘举动意见不一,认为它要么是软弱的,要么是迂回的战略。最终,程序员们发现这一举动只是一个bug的结果,这个bug导致计算机没有选择它实际计算出的最佳举动——这可能是一种随机游戏。这个错误直到第四场比赛后才被修复,而卡斯帕罗夫的精神早已崩溃。


大卫•奥尔巴赫他是一位作家和软件工程师,住在纽约。他是位智专栏的作者板岩。


参考文献

1.IBM欠人类一场重赛。《时代》杂志149, 66 - 67(1997)。

2.许,F.H.深蓝背后:打造击败国际象棋世界冠军的计算机普林斯顿大学出版社(2002)。

3.Müller, M.电脑开始。人工智能134, 145 - 179(2002)。

4.特纳,M。《思想的起源:融合、创造力和人类火花》(The Origin of Ideas: blend, Creativity, and The Human Spark)牛津大学出版社(2014)。

5.福康涅和特纳《我们思考的方式:概念融合和思维隐藏的复杂性》(The Way We Think: Conceptual Blending and The Mind’s Hidden complexity)Basic Books,纽约,纽约(2002)。

6.米勒,人工智能天才的洞察:科学和艺术中的意象和创造力麻省理工学院出版社(1996)。

7.G.-C轮值表。和Palombi, F。不分开的想法Birkhauser波士顿(1997)。

8.Thomure, m.d., Mitchell, M., & Kenyon, G.T., On the role of shape prototypes in hierarchical models of vision。2013国际神经网络联合会议1-6(2013)。

9.葛里炸药,S。et al。计算机围棋的重大挑战:蒙特卡罗树搜索和扩展。ACM的通信55, 106 - 113(2012)。

15条评论-加入讨论