极限思维：未来科学的进步将取决于人类还是AI？

今天的科学处于十字路口：科学的进步会被人类的思维还是被人类创造的机器驱动？

科学事业中正出现分歧。一方面是人类的思维，这是我们物种所珍视的每一个故事、理论和解释的源头。另一方面是机器，这些机器的算法具有惊人的预测能力，但其内部工作方式对于观察者来说却完全不透明。

当我们人类努力理解世界的本质时，我们的机器就产生了可测量的、切实可行的预测，这些预测似乎超出了人类思维的范围。尽管通过了解因果关系的叙述来理解世界可以满足我们的好奇心，但是预测则满足了我们的希望，将预测出的机制映射到了现实中。我们现在面临着哪种知识更重要的选择，以及是否人力正在阻碍科学进步的问题。

直到近代，理解和预测还是反对无知的盟友。弗朗西斯·培根（Francis Bacon）是科学革命初期将它们整合在一起的第一批参与者，当时他认为科学家应该在世界范围内进行交流，改进他们使用的仪器。他说，这种方法可以避免因试图掌握现实而造成的痛苦停滞和循环性。在他的《新工具论》（Novum Organum，1620）中，他写道：

我们发现科学的新方法几乎没有提高智力的敏锐度，也没有将人的智力提高到新的等级。如用手画一条直线或精确的圆一样，直线和圆的精确度很大程度上取决于手的稳定性和实践性；但是如果使用尺子或指南针，则直线和圆的精确度与手几乎无关，科学界现有的方法也是如此。

培根合理地建议应该使用工具来增强人类的感知和理性，而且通过这些手段人类可以逃避沉思的迷宫。

艾萨克·牛顿（Isaac Newton）热情地采纳了培根的经验哲学。他在他的职业生涯中致力于开发工具：物理镜头和望远镜，以及心理帮助和数学描述（形式化），所有这些都加快了科学发现的步伐。但是，对工具日益增长的依赖隐藏了令人不安的分歧的种子：哪些是人类的思维可以辨别出的世界的潜在机制，哪些是我们的工具能够进行测量和建模的。

如今，这种分歧可能会威胁到整个科学项目的进步。我们似乎已经达到了极限，在这种极限下，理解和预测、机制和模型失去了一致性。在培根和牛顿时代，易于理解的世界叙述以及可检验的预测形成了一个良性循环。引人入胜的理论以现实世界的观察为后盾，使人类对从天体力学到电磁学和孟德尔遗传学的一切事物都有了深刻的理解。科学家已经习惯了使用动态规则和规律表达的直观理解——例如查尔斯·达尔文（Charles Darwin）的自然选择理论和格雷戈尔·孟德尔（Gregor Mendel）的独立分类原理——来描述生物体的基因物质如何通过其父母染色体的分离和重组而传递下去。

但是在“大数据”时代，理解和预测之间的联系不再成立。现代科学在解释原子、光和力等相对简单的问题上取得了惊人的进步。现在，我们试图理解更复杂的世界，从细胞到组织、从大脑到认知偏见、从市场到气候。新颖的算法使研究人员能够预测这些学习和进化的自适应系统行为的某些特征，同时仪器可以收集有关它们的大量信息。

尽管这些统计模型和预测通常可以使事情变得正确，但科学家们几乎不可能重建它们的工作方式。仪器智能（通常是机器智能）不仅具有抵抗性，而且有时会积极地反对理性。例如，对基因组数据的研究可以捕获数百个参数——如患者、细胞类型、病情、基因、基因位置等——并将疾病的起源与成千上万的潜在重要因素联系起来。但是，这些“高维”数据集及其提供的预测让研究人员无法进行解释。

如果科学界可以用牛顿模型和量子模型预测人类行为，那学者们可以进行解释，但是仍不能预测。科学与复杂现实之间的坦率冲突产生了分歧。一些批评家声称，这是人类自己的顽固的人类中心主义（坚持认为我们的工具比不上我们的智力），它阻碍了科学的发展。

他们说，如果不再担心机器取代人类的思维，研究人员可以使用机器来加速对事物的掌握。计算机智能的模拟不需要具有神经系统的结构，就像望远镜不需要具有眼睛的解剖结构一样。的确，射电望远镜提供了一个令人信服的例子，证明了一种新颖的非光学机制可以超越纯粹的光学功能，射电望远镜能够探测到银河系视线以外的其他星系。

理解与预测之间的巨大分歧呼应了巴鲁克·斯宾诺莎（Baruch Spinoza）对历史的见解：“分歧不是源于对真理的热爱，而是源于对控制权的过分渴望。”未来的战斗是大脑和算法谁会成为科学王国的主人。

悖论及其感性的表亲——幻觉，提供了两个有趣的例子，说明了预测和理解之间的混乱关系。两者都描述了这样的情况：我们以为我们理解了某些东西，但其实只是遇到了特殊情况。理解的过程似乎不那么容易理解。

某些最著名的视觉错觉会在同一物体的两种不同解释之间“翻转”，例如面花瓶、鸭子兔子^[1]和内克尔立方体（Necker cube）（线框立方体，可以在两个方向之一感知，而任一面都最接近观看者）。所有人都知道现实生活中的物体并不会真正像这样打开一角，但这正是我们的感官在告诉我们的。痴迷于鸭兔错觉的路德维格·维特根斯坦（Ludwig Wittgenstein）提出，人们首先按照一种主要的解释来观察一个物体，而不是仅仅在看到一个物体之后才去理解它。我们所看到的就是我们希望看到的。

认知科学家理查德·格里高里（Richard Gregory）在他的精彩著作《看穿错觉》（Seeing Through Illusions，2009）中称错觉为“挑战我们现实感的奇怪感知现象”。他解释了它们是如何发生的：这是因为我们的理解是基于多个具有不同规则的系统的预测而得出的。在内克尔立方体中，每个感知都与三维空间中的感知数据一致。但是缺乏深度线索意味着我们无法确定哪种解释是正确的。因此，由于缺乏对空间足够的理解，我们在两个预测之间切换。

像幻觉一样，悖论使得直觉与关于世界的基本事实相冲突。悖论是自相矛盾或逻辑上站不住脚的论点或观察的结论。它们在自然科学中经常出现，尤其是在物理学上：无论是其哲学还是科学具象中。双生子佯谬^[2]、爱因斯坦-波多尔斯基-罗森佯谬^[3]和薛定谔的猫^[4]，都是由相对论或量子力学的基本结构而来的悖论。这些与观测佯谬（例如在双缝^[5]实验^[6]中观测到的波粒二象性）完全不同。然而，在这两种悖论中，人类基于平时因果推理的理解与实验的预期结果不一致。

当规则被应用于结构不同的输入时，我们可以预期会出现奇怪的现象

甚至机器也可能遭受悖论的困扰。“辛普森悖论”^[7]描述了一种情况，即对于单个数据集中独立出现的趋势，当数据集组合在一起时趋势可能消失甚至逆转，这意味着一个数据集可用于支持相互竞争的结论。此类情况在体育运动中经常发生。在任何给定的赛季中，单身选手的表现都优于其他选手。但是，如果将多个赛季组合在一起，则由于绝对差异（例如总比赛次数、击球次数等），这些球员将不再领先。

还有一种称为“准确性悖论”的事物，其出于循环论证的原因表现优异。也就是说，他们的解决方案实际上已经应用于到他们的事例中。这背后有许多算法偏见^[8]的例子，其中基于种族^[9]和性别的少数群体经常被错误分类：这是因为用作准确性标准的训练数据来自我们自己的偏见和不完美的世界。

关于悖论的最严格的工作也许是库特·哥德尔（Kurt Gödel）在《数学原理和相关系统形式上不确定的命题》（Formally Undecidable Propositions of Principia Mathematica and Related Systems，1931）中进行的。哥德尔发现，在每个严格形式化的数学系统中，从系统本身的公理派生出来的陈述，都无法得到确认或反驳。形式化系统的公理允许出现矛盾的可能性，而这些矛盾构成了悖论的基础。哥德尔的基本见解是，任何规则系统都具有适用的自然领域。但是，如果将规则应用于被其他规则支配的结构中，那么我们可以预期会出现奇怪的现象。

这正是对抗神经网络可能发生的情况。在对抗神经网络中，两种算法相互竞争以赢得一场比赛。一个网络可以被训练用来识别一组对象，例如停车标志。同时，它的对手可能会对新的数据集进行一些恶意的小修改，例如移走一些像素的停止移动标志，这导致第一个网络将这些图像归类为限速标志。从人类的角度来看，对抗性分类看起来极度愚蠢。但是，正如哥德尔所理解的那样，从神经网络中隐藏的编码规则系统的角度来看，它们可能是自然出现的错误。

悖论和错觉向我们显示的是，我们预测和理解的能力取决于思维的本质缺陷，并且对理解的限制可能与对预测的限制大不相同。就像预测从根本上被测量的敏感性和计算的缺点所限制一样，理解同时被推理规则促进和阻碍。

“局限”是什么的问题，阐明了为什么人类首先会被机器和形式化所吸引。科学文化和广泛意义下的技术的发展，是突破认知和语言局限性的手段的集合，这里的局限性指培根在《新工具论》（Noum Organum）中的bête noir。

理解和预测之间的关系对应于本体论（对世界的真实本质的洞察）和认识论（获取有关世界的知识的过程）之间的联系。基于实验的知识可以突破我们现有理解的障碍，使我们欣赏新的基本特征。反过来，这些基本法则使科学家们可以得出新的预测，以便在世界范围内进行检验。

当被称为“集合论”^[10]的数学分支被证明引起悖论时，后来被称为“范畴论”的分支获得发展，以部分克服这些局限性。当使用太阳系的托勒密模型或牛顿力学模型获得不正确的天文预测时，人们引入了相对论来捕捉大质量物体在快速运动中的异常行为。这样，理论的本体基础就成为了新的和更好的预测的基础。本体论促进认识论的发展。

但是，一旦科学进步达到一定的极限，本体论和认识论就会成为敌人。在量子力学中，不确定性原理指出，粒子的动量和位置不能同时被精确知道。它既描述了进行精确测量的一个限制（认识论），又似乎涉及一种机理，即在量子尺度上（本体论）造成了位置和动量的不可分离性。在实践中，量子力学涉及有效地应用该理论以预测结果，而不是凭借直觉产生结果。换句话说，本体论被认识论所吸收。

相比之下，量子力学基本机理的领域试图突破这一极限，并解释量子理论为何如此具有预测性。例如，“多世界”^[11]的解释废除了量子幽灵（quantum spookiness），取而代之的是令人难以置信的命题，即每一个观测都产生一个新的宇宙。在这个极限下工作的兴奋之处是智力探究在预测和理解之间闪烁。区分认识论问题和本体论问题并不是一件容易的事。它们是紧密相关的，甚至是“耦合”或“纠缠”的。

解决该问题的一种无情的方法就是简单地声明：在适当的限制下，本体论消失了。哥本哈根学派玩弄精确的手法，其消极的攻击性格言是：“闭嘴并计算！”（ ‘Shut up and calculate!’ ）。换句话说，不要再谈论量子幽灵的可能解释了。寻找量子力学的基本机制是在浪费时间。然而现在是现代计算机，而不是量子理论学家，它没有表达的倾向，除了进行安静而艰难的计算之外，量子力学不能干其他事情。

理解发音不是目的，预测正确的翻译才是

很少有科学家愿意接受如此微不足道的知识交易。在科学中，一个好的表现优雅^[12]的理论几乎是不言而喻的，它编码了一个可以直观地理解和交流的简单（或“简约”）解释。关于事物的观点，一个好的理论可以使一个人在头脑中持有一个整体的概念，以即兴创作一个微型的内部宇宙。在某些领域，特别是在数学物理中，人类大脑的微型宇宙和现实的大型宇宙融合在一起。苹果和行星都遵循由相同运动方程式描述的轨迹。这种快乐的巧合可以被形容为“谐和性”，“一致性”或“尺度不变性”。

这些一致的理论中最引人注目的是某些力的强度与到源的距离的平方成反比，这对于大尺度的重力和小尺度的电磁力都成立。正如已故的物理学家默里·盖尔曼（Murray Gell-Mann）所说^[13]：

当我们剥去洋葱皮时，渗透到基本粒子系统的结构越来越深，由于它在一个层级上的效用而使我们熟悉的数学衍生出新的数学，其中一些可能应用在一个降低的层级或同一层级的另一种现象上。有时，即使是古老的数学也足够了。

但是有时我们自己的直觉会阻碍科学的进展。使用计算机对自然语言进行分类、翻译和学习的案例说明了寻求科学现象的直观描述的危险。HAL 和 Robby the Robot 的魅力来自电影《2001：太空漫游（1968）》和《禁忌星球（1956）》，这是他们理解人类语言并以适当水平做出不祥讽刺回应的能力，这些回应对于他们的人类对话者来说是可理解的。

但是机器翻译和语音识别的发展最终看起来并不像这样。80年代和90年代最成功的早期语音识别方法采用基于人类语音结构的数学模型，重点是单词类别以及句子的高阶句法和语义关系。然后在90年代后期，深度神经网络迅速发展。这些算法忽略了许多先前的语言知识，而是通过在纯声学级别上的训练，使单词自发出现。理解发音不是目的，预测正确的翻译才是。深度学习算法具有极高的效率。一旦研究者社区接受算法的不透明性，那么实用的解决方案将变得非常清晰。

神经网络刻画了当代科学所面临的困境。它们表明，基于数十年的研究和分析，仅包含很少或不包含关于系统结构化数据的复杂模型仍能胜过理论。在这方面，训练计算机在语音识别的见解反映了其在国际象棋和围棋中击败人类的见解：机器偏爱的表示和经验法则不需要反映人脑偏爱的表示和经验法则。对机器来说，解决国际象棋就是解决国际象棋，而不是思考。

但是，我们克服国际象棋和语音识别中人类思维局限的方式是否说明克服人类对物理现实的预测的局限（即在科学上取得进步）也可能意味着什么？它能告诉我们人类对理解的需求是否正在阻碍科学的进步吗？

哲学史为摆脱当前的科学困境提供了一些途径。柏拉图是最早在《泰阿泰德篇》（Theaetetus）一书中提出解决理解混乱的人之一。文中专门讨论认识论的问题，即一种感知、一种真实的判断、一种真实的信念和附加的解释。在对话中，苏格拉底（Socrates）将几何，算术和天文学归为最后一类。

依曼纽尔·康德（Immanuel Kant）在其《纯粹理性批判》（Critique of Pure Reason，1781）中进一步发展了理解的理论。康德在物质世界和心理世界之间进行了区分，即现实作为本体论，而心理知识则作为认识论。对于康德来说，心中只有世界的表象，只有通过这些表象才能认识物质世界。这意味着我们所谓的理解不过是对经验现实的一种近似和不完美的表示，其柏拉图式的存在（或可能不存在）是知识的最终极限。康德的论点并不能真正帮助我们将理解与知识区分开；而是将理解从可以辩护的信念转变为无法验证的内部表示。

哲学家约翰·塞尔（John Searle）在他的有影响力的著作《思想，大脑和科学》（Minds，Brains and Science，1984）中探索了知识和理解上的区别，在这本书中他挑战对机器智能盲目乐观的人。塞尔要求我们想象一个房间里的某个人对汉语没有一点地道的理解，但准备了一套字典和语法规则。当呈现出中文句子时，这些资源被用于将目标句子翻译成英语。当人们考虑这一思想实验时，很明显一个人不需要理解一个人正在翻译的语言，只需使翻译达到保真即可。

中文房间（Chinese room）是一种隐喻性的手段，可以分析算法的局限性，例如可以列出数字场景中的元素或翻译网页上句子的算法。在这两种情况下，在没有任何理解内容的情况下都能产生正确的解决方案。那么，塞尔正在寻找的缺乏理解的本质是什么？

理解本质是知识传播与积累的基础

有许多培根工具可以代替塞尔的房间，例如用于解决大型乘法问题的计算规则，或使用罗盘和量角器证明定理，或在微积分中用于解决大或无穷大的积分规则。这些技术之所以有效是因为它们消除了对理解的需求。它只需准确地按照规定的步骤进行操作即可，以确保获得预期的结果。在每种情况下，要理解的是要解释对数的逻辑和适当用法，量角器或罗盘的运动几何特性，或用矩形近似面积的基本数学基础。因此，即使在日常数学运算中，我们也会经历理解和预测之间的分歧。

理解是我们通过打开知识的黑盒子进行修改来克服悖论和幻想世界的手段。理解是对合理错误的阐明。一旦我们理解了线框立方体被解释为三维的立体图形，那么我们很清楚为什么我们一次只能看到一个立方体。

无需解释和理解也可以获取数据。不良教育的确切定义是钻研事实：就像在死记硬背的日期和事件中学习历史一样。但是，真正的理解是期望其他人类或更广泛的代理人可以向我们解释他们的方法如何以及为什么起作用。我们需要一些方法来复制一个想法并验证其准确性。该要求扩展到了声称能够智能地解决问题的非人类设备。机器需要能够说明其能够完成的工作以及为什么可以工作。

解释的要求是解释什么将理解与教学联系起来。“教学”是我们对因果机制进行有效沟通的称呼（“如果你遵循这些规则，你将学会长除法），而“学习”则是对原因及其结果之间关系的直觉的获得（“这就是长除法规则有效的原因”）。理解本质是知识的文化积累与可靠传播的基础。此外，它也是所有长期预测的基础。

有性格的作家豪尔赫·路易斯·博尔赫斯（Jorge Luis Borges）在论文《名字回响的历史》（History of the Echoes of a Name，1955）中写道^[14]：

在时间和空间上孤立，一个神、一个梦和一个精神异常并且意识到事实的人重复了一个晦涩难懂的陈述。这些单词及其两个回声是这段历史的主题。

假设上帝是宇宙，是我们渴望理解的梦想，而机器是疯狂的人，重复着他们晦涩难懂的陈述。总之，他们的言语和回声是我们科学探索的系统。将复杂性科学与机器学习和人工智能相结合是21世纪的挑战。未来知识最成功的形式将是使人类的理解梦想与机器越来越模糊的回声协调一致。

（作者：集智俱乐部 David C Krakauer 译者：潘佳栋）

涉及观点仅代表个人，与本站立场无关。本站不对内容的真实性及完整性作任何承诺。

极限思维：未来科学的进步将取决于人类还是AI？

当规则被应用于结构不同的输入时，我们可以预期会出现奇怪的现象

理解发音不是目的，预测正确的翻译才是

理解本质是知识传播与积累的基础

您可能也感兴趣：