CAI教授物理定律?传统的计算机会很快被深层神经网络所取代吗?当然,如果你一直在追随这个消息,那么最近一直充满了头条新闻,“神经网络解决三体问题的速度要快1亿倍机器学习提供了一种全新的方法来解决应用数学的经典问题之一。如果有了机器学习,谁还需要哥白尼?”另一位记者在一篇题为《人工智能教自己物理定律作为“人工智能和物理学的里程碑时刻”,它“可能是解决量子力学问题的关键”。
问题是,作者们并没有给出令人信服的理由来证明他们确实可以做到这一点。
这些说法都不是真的。所有这些研究都来自最近的两项研究,这两项研究使用机器学习来探索行星运动的不同方面。这两篇论文都代表着对新事物的有趣尝试,但都不能保证令人兴奋。这两篇论文中夸大的说法,以及由此引发的炒作,都是科学记者——有时是科学家自己——夸大人工智能和机器学习新进展重要性的趋势的征兆。
和往常一样,当人们看到对AI系统的大量评论时,首先要问的问题是:“这个系统实际上是做什么的?”
三体问题
三体问题是预测三个物体(通常是行星或恒星)在相互引力作用下如何随时间移动的问题。如果只有两个物体,那么,正如牛顿证明的那样,其行为很简单:每个物体都沿着一个圆、一个椭圆或一个双曲线运动。但是,正如牛顿和他的继任者们所确定的,当有三个或更多的物体参与时,行为会变得非常奇怪和复杂。没有简单的数学公式;在很长一段时间内进行准确的预测变得非常困难。找出解决三体问题的好方法n-身体问题(同样的问题,有更多的物体)300年来一直是计算物理学的主要挑战。“AI解决了三体问题”的文章是基于arXiv上一篇题为“AI解决了三体问题”的文章。牛顿vs机器:用深度神经网络解决混沌三体问题。”
通常情况下,技术类文章没有通俗文章那么夸张,但是,作为一篇技术类科学文章,这篇文章还是很有野心的。文章最后预测,为狭义情况开发的技术将扩展到一般的三体问题,然后最终扩展到四体和五体问题以及其他混沌系统,这可能构成一场真正的革命。
问题是,作者们并没有给出令人信服的理由来证明他们确实可以做到这一点。事实上,他们甚至还没有完全解决现有的三体问题。相反,他们只关注三体问题的一种特殊情况,即三个质量相等的粒子以零速度从特定位置出发。
即使在这里,它们也完全依赖于传统的物理引擎或模拟器——也就是说,没有人工智能,没有机器学习,只是传统的运动微分方程的数值解——从10000个不同的起始位置生成运动轨迹。
媒体的热情正在传递一种错误的印象,让人觉得任何老问题都可以用神经网络来解决。
然后他们使用这个经典的衍生数据库作为输入,来训练神经网络。在新例子上测试神经网络,其真解也由模拟器计算出来,他们发现神经网络可以以合理的准确性预测粒子的后期位置,比传统的模拟器快几个数量级。
从本质上说,他们所做的就是将神经网络作为一种新的工具,用于从外部经典系统中得到的已知值进行插值。与其他技术相比,神经网络可能更擅长于用平滑的值空间进行插值,但大部分工作都是由外部先验系统完成的。而且,关键的是,他们还没有证明,同样的插值方法在现实世界中更复杂的物理中也能起作用,即使是在简单的情况下(质量不同的粒子),更不用说在有多于三个物体的情况下。
同时,在技术术语中,即使在三体问题中,他们已经解决的这类问题也只是一个简单的子集,即两个自由度——也就是说,一个问题的实例是由两个数值参数决定的——而一般的三体问题有10个自由度。在这个问题的有限版本中,你在构建一个从根本上改变行为的问题时,唯一的选择就是相对于前两个物体,第三个物体应该放在哪里。在整个问题中,他们没有尝试,你可以额外选择第二个和第三个物体的质量和初速度;这些选择中的每一个都能从根本上改变系统随时间的演变。
我们知道这类问题的复杂性会随着自由度的增加呈指数增长。所以他们解决的问题并不是一般问题的五倍,而是简单得多。随着点的增加问题很快变得更糟四体问题有17个自由度,五体有24个自由度n身体已经7n-11年。
其次,如果你只需要担心两个维度,那么计算10,000个数据点给出了很好的覆盖范围。如果让我们想说,你想张开一座山的形状,你在100 00 x 100网格上的每一点都是10,000点的升高 - 那么你可以在非常可靠地估计任何点的仰角。随着尺寸的数量增加,事情变得更加复杂,并且平稳插值工作的可能性减少。
第三,科学家们没能在房间里对付800磅重的混乱蝴蝶:对起始条件的高度依赖。两种稍有不同的启动条件可能导致完全不同的结果。这不是你用来做预测的算法的限制;这是问题的固有特征。因此,声称一个机器学习系统学会了预测一个长期的混沌系统,就像说它学会了预测一个随机过程的行为,比如热噪声或放射性衰变。不管用什么算法,这都是不可能的。(荣誉卡罗琳·德尔伯特在《大众机械》注意到这一点;大多数记者都错过了它。)
最后,即使是与传统模拟器的比较也是有缺陷的。纽约大学数学系的乔纳森·古德曼(Jonathan Goodman)是这类动力系统的专家,他向我们保证,现代自适应方法计算这些轨迹的速度比论文中引用的时间要快得多;传统的模拟器是一个吸管模型。
哥白尼
哥白尼计划的情况也好不到哪里去。
这里有一组不同的作者,在即将出版的作品中在物理评论快报,构建了一个神经网络,旨在从物理过程中获取数值数据作为输入,并提取决定过程行为的关键参数。他们描述了四个涉及不同类型的简单物理系统的实验,在这些实验中,他们的神经网络如他们所希望的那样成功了。
从天文观测中重新发现哥白尼体系的假设引起了大众媒体的兴奋。
麻烦的是,说他们的神经网络是“地球和火星围绕着太阳的围绕太阳”是完全误导的。神经网络实际上并不明白任何东西都在几何意义上旋转了任何东西;它没有几何形象,不知道旋转意味着什么。所有神经网络都确实是提取涉及的两个数值参数;它不知道这些代表来自一些固定的中心点的角度。就网络而言,这些可能是来自两个不同中心点的时变质量或电荷或电荷。提取数据源之间的相关性,但系统无法推断出与世界相关的数据源如何;它是人类科学家,他们将这些人视为从太阳衡量的地球和火星的角度,以及摘要这些参数最好被解释为轨道的事实。哥白尼的实际发现的所有真正工作都提前完成;系统是一个计算器,而不是发现者。
此外,在作者生成的合成数据中,地球和火星在同一平面上以等速圆形轨道运行。在真实的太阳系中,情况要复杂得多:火星轨道平面倾斜1.8度o到地球轨道(黄道)的平面。因此,火星相对于恒星的明显位置不只是在一个东西圆上移动,就像如果这两个轨道是共平面的那样;它也在南北弧线上来回移动大约4o长。经过几年的观察,火星在天空中的位置不会停留在一个简单的圆形路径上;它的横线是4o宽阔的最广泛。Copernicus的真正挑战(在现代计算机之前解决,没有大数据)比网络不得不处理的更复杂。
4度听起来可能很小,但以天文观测的标准来看,它是巨大的。相比之下,猎户座的腰带只有2.7英寸o宽。托勒密的测量天文学大成大多精确到1/10度以内。
因此,太阳系的PToLEMAIC和COPERNICAN模型必须具有解释火星和其他行星的这种横向运动的机制。因此,哥白尼模型必须比神经网络(在某种意义上)产生的简单模型更复杂,其中地球和火星在圆形轨道上围绕太阳旋转。事实上,哥白尼模型包括48个套子,超过PToLEMAIC模型,尽管它在其他方面更简单。网络系统甚至没有从事横向运动。
由于他们所谓的成功,复制哥白尼的成就,作者和记者期待这种机器学习技术可以在理论物理学中的根本进步的日子。一篇文章在自然新闻甚至热情地说,“自学物理定律的神经网络可以帮助解决量子力学之谜。”
这纯粹是幻想。在本实验的例子中,观察到的数据和提取的参数之间的关系是相当直接的。相比之下,在大多数量子理论的实验证据中,观测和基本理论之间的关系是非常间接和微妙的,需要非常巧妙的理论来揭示;检测这些神经网络系统的相关性,甚至还没有触及所需的表面。
为什么重要
这些特定研究的缺陷本身并不大,但它们被报道的方式是一个问题的症状,而这个问题实际上是严重的。这种夸大其词的报道让人们错误地相信了这个观点——最臭名昭著的是克里斯·安德森在2008年发表的那篇臭名昭著的文章,理论的终结:数据泛滥使科学方法过时,并日益成为普遍的时代思潮的一部分,即人工智能和深度学习理论将很快取代所有其他计算方法,甚至是知识方法,而目前这类方法还没有建立起来。媒体对深度学习的热情正在传递一种错误的印象,让人觉得任何老问题都可以通过庞大的神经网络和正确的数据集来解决,而无需关注该领域的基础知识。
事实是,世界上很多艰难,开放的问题都需要特别的域名专业知识。在这两篇论文中的问题中,这意味着如果有人想要对三体问题或类似问题的解决方案做出有用的贡献,必须花费严重的时间研究微分方程的复杂科学,数值计算,和动态系统。在自然语言理解的领域中,它可能类似于包括语言学和精神语言学的大量工作,而不是收集大型数据集和大型复杂计算机的大会。
普遍错误的印象,数据+神经网络是一个通用的公式有真正的后果:在科学家选择的研究中,在企业和政府选择基金,在期刊和会议选择接受出版,在学生选择学习什么,在大学选择教书。事实是,神经网络,无论以何种形式,都无法取代经过几个世纪发展起来的复杂的科学分析工具,迄今为止还没有复制过过去的伟大科学成就,更不用说对它们进行改进了。它们应该被视为补充现有技术的工具,而不是对我们如何进行科学研究的基础修正。
确认
感谢乔纳森·古德曼提供了关于三体问题研究的非常有用的信息,感谢他和凯尔·克兰默对草稿的有益反馈。
加里·马库斯和厄尼·戴维斯合著了重新启动人工智能:构建我们可以信任的人工智能,以及许多关于认知心理学和人工智能的科学和流行文章。
加里·马库斯是一位科学家、畅销书作家和企业家。他是公司的创始人兼首席执行官健壮。人工智能他是机器学习公司几何智能(Geometric Intelligence)的创始人兼首席执行官,该公司于2016年被优步收购。除了重启电脑,他是五本书的作者,包括代数思维克鲁格,思想的诞生,纽约时报最好的卖家吉他零。
Ernie Davis是纽约大学龙门数学科学研究所的计算机科学教授。他是世界领先的人工智能常识推理专家之一。他是四本书的作者,包括教科书常识性知识的表示和线性代数和计算机科学应用概率,和信息时代的经文,轻诗集他与已故的父亲菲利普·j·戴维斯(Philip J. Davis)一起担任编辑工作数学、实体与猜想:数学的意义与本体论。
铅图像:metamorworks / Shutterstock







