【城主说】陶哲轩被誉为当今世界最天才的数学家,“数学界莫扎特”,。这位菲尔兹奖与数学突破奖得主,其工作的广度与深度常被拿来与百年前的巨人希尔伯特相提并论。然而,在一个人工智能以前所未有的速度渗透进人类智力活动最前沿的时代,即便是陶哲轩这样的大脑,也在重新思考数学的本质、证明的形态以及未来的研究范式。 在这场与莱克斯·弗里德曼的对话中,陶哲轩抛出了一系列极具颠覆性的观点。其中最核心的,或许是他对理论本质的精辟概括:一个好的理论,就是对现实世界的一种极致高效的“压缩”——用最少的参数,解释最多的观测。这个看似简单的比喻,不仅揭示了从纳维-斯托克斯方程到广义相对论等物理难题的核心,也为我们理解人工智能在未来科学发现中的角色,提供了一个全新的视角。当机器开始辅助甚至独立探索时,我们如何判断一个新“理论”的优劣?陶哲轩的答案,可能就藏在这“压缩效率”之中。 对于普通人而言,数学难题往往意味着无尽的复杂计算。但在陶哲轩看来,真正困难且有趣的问题,其核心魅力在于其内在的结构性矛盾。他以著名的“百万美元难题”——纳维-斯托克斯方程(Navier-Stokes equations)为例,揭示了这类问题的深层困境。这个支配着流体运动的方程,其难点在于,我们无法从数学上完全排除一种极端情况:能量通过一种诡异的“阴谋”,不断从大尺度集中到越来越小的尺度,最终导致速度变为无限的“爆破”(blow-up)。 这种现象,陶哲轩用了一个绝妙的类比来解释:麦克斯韦妖。这是一个思想实验中的“小恶魔”,它能以一种违背统计学规律的方式操纵粒子,导致系统出现极不可能的有序状态。在流体力学中,这个“恶魔”就是一种潜在的自组织机制,它能抵抗住使流体趋于平静的黏性力,将能量汇聚于一点。 那么,回到纳维-斯托克斯方程,流体具有一定量的能量。而由于流体处于运动状态,能量会随之传输...但潜在地存在某种“恶魔”,不断将流体的能量推向越来越小的尺度。它会移动得越来越快...可能会出现一种所谓的自相似爆发情景,即流体的能量从某个大尺度开始,然后将其全部能量传递到一个更小的流体区域,接着以更快的速度进入一个甚至更小的区域...能量实际上可以在有限时间内会聚到一点。 面对这种看似无法攻破的难题,陶哲轩展现了他作为“狐狸型”数学家的典型策略:与其正面硬攻,不如战略性“作弊”。他通过修改物理定律,关闭了方程中某些使能量分散的“通道”,人为地创造了一个更容易发生“爆破”的简化模型。这个模型虽然不是真实世界,但它的存在本身就构成了一道“障碍”,它告诉所有试图证明“爆破永不发生”的数学家:你们的证明,必须利用到真实方程中那些被我关闭掉的、微妙的特性。 而这个过程,将他的思维引向了一个更为大胆的奇想:构建一台“流体计算机”。他意识到,如果能通过设计特定的流体初始形态,让水流的碰撞模拟出逻辑门(与门、或门),那么原则上,就可以用流体构建一台图灵机。这台“水朋克”式的计算机,可以被编程来执行一个任务:创造一个更小、更快的自身副本,然后将所有能量传递给它并“关闭”自己。这个过程不断迭代,就将构成一个真正的“爆破”解。 所以我意识到,如果你能对实际方程实现同样的事情,也就是说如果水的方程支持计算...你可以将它们串联起来,或许就能创造出一台图灵机。这样你就能拥有完全由水构成的计算机了...所以如果你能建造一台流体机器,它就是一台流体机器人。它的作用...是被编程为会以某种“冷”状态创造出自身的更小版本...这个配置好的水体形态的大机器人会将其所有能量转移给更小的配置体,然后关闭。然后剩下的就是这种最新的状态,它会随后启动并做同样的事情,但更小、更快。 从一个经典的偏微分方程问题,到构造一个“作弊”的玩具模型,再到设想一台能自我复制的“流体计算机”——这个思维路径,完美展现了陶哲轩的解题艺术:不畏惧问题的复杂性,而是通过跨领域的类比(从热力学到计算理论),去寻找和构建理解问题本质的全新框架。 在陶哲轩的数学观中,存在一个反复出现的核心主题,一个深刻的二元对立:结构(Structure)与随机(Randomness)。他认为,数学中绝大多数对象,比如圆周率的数字,看起来都是随机的,不具备任何明显规律。然而,数学家花费大量精力研究的,往往是那些罕见的、具有优美结构的对象。而数学中最深刻、最困难的问题,恰恰诞生于这两股力量的交汇处。 自然数附带有两种基本运算:加法和乘法...任何只涉及加法的自然数问题都相对容易解决,任何只涉及乘法的问题也相对容易解决。但令人沮丧的是,当你将两者结合起来时,突然间你就得到了这种极其丰富…的结构。即使是最简单的问题,如果它们将乘性事物(例如质数)与加性事物(例如偏移2)结合起来...将这两者关联起来一直异常困难。 质数由乘法定义,其分布看起来极其随机;而“相差2”则是一个纯粹的加法结构。这个猜想,本质上是在问一个随机性的海洋(质数)中,能否稳定地出现一个特定的结构(孪生对)。陶哲轩指出,这种模式非常“脆弱”,你只需从素数集合中精心地移除极少数成员,就能让孪生素数猜想不成立,同时几乎不改变素数整体的统计性质。这意味着,任何证明都必须依赖于素数某种极其精细、非统计的内在属性。 与此相反,他和本·格林(Ben Green)证明的格林-陶定理,则处理了一种更为“稳健”的结构——等差数列。他们证明,无论你如何随机地从素数中剔除绝大部分成员,剩下的集合里依然会像“蟑螂”一样,顽固地存在任意长度的等差数列。 算术级数之所以坚不可摧,是因为无论你的集合看起来是随机的还是有结构的,比如周期性的,在这两种情况下,算术级数都会出现,但原因不同。这基本上就是这些定理的证明方式,这类算术级数定理有很多证明,它们都是通过某种二分法证明的,其中你的集合要么是有结构的,要么是随机的,在这两种情况下,你都可以得出一些结论...但在孪生素数中,如果质数是随机的,那么你就很高兴,你就赢了。但如果你的质数是有结构的,它们可以以一种特定的方式构造,从而消除孪生素数。而且我们不能排除那种阴谋。 这种“要么有结构,要么是随机”的二分法,是现代数学,尤其是组合数学和数论中的一个强大思想。它允许数学家将一个复杂问题分解为两种情况:如果对象是随机的,就用概率论的工具;如果对象是有结构的,就用代数或傅里叶分析等工具。无论哪种情况,都能取得进展。这正是陶哲轩所说的“逆定理”(Inverse theorems)的威力所在——它们提供了一种方法,去检验一个看似随机的对象背后,是否隐藏着某种深刻的结构。 如果说“结构与随机”是数学世界的内在法则,那么人工智能(AI)和形式化证明工具,则是正在重塑其外在形态的革命性力量。陶哲轩坦言,自己正深度参与这场变革,尽管他将目前与AI协作的体验形容为赶猫 herding cats——充满潜力,却也极其耗费心力。 他所使用的核心工具是Lean,一种形式化证明语言。它能将数学证明转化为计算机可以100%验证的代码,但代价是巨大的。陶哲轩估计,将一个人类证明形式化,目前需要花费10倍的时间和精力。这就像在向一个极其吹毛求疵的同事解释你的论证,他会质疑你的每一个微小步骤。 Lean是一种也能做到这一点的语言。它也可以作为一种标准的传统语言运行,但它也可以生成证书...Lean不仅能得出答案,还能提供它是如何得出7这个答案的证明...所以现在我估计,形式化一个证明所需的时间和精力大约是将其写出来所需时间的10倍。是的,所以这是可行的,但你不会……这很烦人。 然而,这种烦人的精确性,却带来了两个意想不到的巨大优势。首先,它让大规模、可信的协作成为可能。在一个涉及50位作者的庞大项目中,陶哲轩和他的合作者们利用Lean,将一个大问题分解为数百万个小问题,并进行众包。由于Lean保证了每一份贡献的绝对正确性,他们可以进行“无信任数学”(trustless math),即接纳任何人的贡献而无需担心其可靠性。 其次,它极大地增强了证明的可维护性。当一个证明中的某个核心参数需要被更新时(例如,将一个常数从12改进为11),在传统的纸笔世界里,这将是一场灾难,需要逐行检查数百页的论证。但在Lean中,编译器会自动标记出所有受影响的代码行,将数周的工作量压缩到一两天。 陶哲轩坚信,我们正处在一个相变 phase transition的前夜。就像当年LaTeX取代所有其他排版工具一样,随着AI助手的不断进化(例如提供更智能的代码补全和引理搜索),将证明形式化的成本与收益之比正在迅速变化。 但总有一天它会降到1以下,那就是相变。因为突然间,写论文时先用Lean写...就变得有意义了...过去发生的一种此类相变是LaTeX的普及...但在某个时间点,LaTeX变得比所有其他竞争对手都更容易使用,人们在几年内就转向了它。那只是一次剧烈的阶段性转变。 他预测,到2026年,我们将看到由AI与人类合作完成的、达到真正研究级别的数学成果。更长远看,AI或许能通过分析海量数据,在两个看似无关的领域之间发现全新的、优美的猜想——这被他认为是AI在短期内最可能实现的、真正震撼人心的突破。 在访谈的最后,当被问及对未来抱有何种希望时,陶哲轩的回答回到了教育和下一代。他认为,科学的进步就在于,“过去非常困难的问题可能会变得微不足道...现在对我们来说似乎不可行的事情,未来可能只是家庭作业练习。” 莱克斯: 以下是与陶哲轩的对话,他被广泛认为是历史上最伟大的数学家之一,常被称为数学界的莫扎特。他曾获得菲尔兹奖和数学突破奖,并在数学和物理学的诸多令人惊叹的领域做出了开创性工作。这对我来说是巨大的荣幸,原因有很多,其中包括泰瑞在与我所有的互动中所展现出的谦逊和善意。这意义重大。这里是莱克斯·弗里德曼播客。 陶哲轩: 嗯,我的意思是,在您的本科教育中,您会学到那些真正困难、看似不可能解决的问题,比如黎曼猜想、双生质数猜想。你可以把问题任意地复杂化。那算不上是真正的问题。事实上,甚至有一些我们已知是无解的问题。真正有趣的是那些恰好介于我们相对容易解决和毫无希望之间边界上的问题,即现有技术可以完成约90%的工作,而你只需要补足剩下10%的难题。 陶哲轩: 我认为,作为一名博士生,柿谷问题无疑引起了我的注意。事实上,它刚刚被解决了。这是我在早期研究中大量涉猎的一个问题。从历史上看,它源于日本数学家柿谷宗一在大约1918年提出的一个小谜题。 陶哲轩: 把它想象成在路上开车之类的。并且你想执行一个U型转弯。你想调转指针的方向。但你想在尽可能小的空间内完成它。所以你想利用这块小区域来将其调转。但这个指针是无限灵活可控的。所以你可以想象只是让它旋转起来。它是一根单位针。你可以围绕其中心旋转它。我认为这会给你一个面积为,我想,四分之π的圆盘。或者你可以做一个三点掉头,这就是我们在驾校教人们做的。而那实际上占用了八分之π的面积。所以它比旋转稍微更有效率。因此,有一段时间人们认为那是使物体调转方向最有效的方式。 陶哲轩: 但贝尔萨科维奇(Bersakovich)指出,事实上,你只需使用任意小的面积就能使针调转方向。比如0.001,你可以进行某种非常奇特的多次来回掉头操作,从而使针调转方向。这样做的话,它会经过每一个中间方向。 陶哲轩: 这是在二维平面内吗?是在二维平面内。所以我们对二维空间中的一切都了如指掌。那么下一个问题是三维空间中会发生什么。那么假设哈勃太空望远镜是太空中的一个管状物,而你想要观测宇宙中的每一颗恒星。所以你想要旋转望远镜以覆盖每一个方向。而这就是不切实际的部分。假设空间非常宝贵,而实际上它完全不是。你想要占据尽可能小的体积,以便旋转你的“针”状物,从而看到天空中每一颗恒星。你需要多小的体积才能做到这一点? 陶哲轩: 因此你可以修改贝尔萨科维奇的构造。那么如果你的望远镜是零厚度,那么你可以使用你所需要的尽可能小的体积。那是对二维构造的一个简单修改。但问题是,如果你的望远镜不是零厚度,而只是非常非常薄,具有某个厚度delta,那么要能够看到每一个方向所需的最小体积作为delta的函数是多少?随着德尔塔变小,随着针变细,体积应该下降。但它下降的速度有多快呢?猜想是它下降得非常非常慢,粗略来说,是呈对数关系地下降。经过大量工作后,这一点得到了证明。 陶哲轩: 所以这看起来像一个难题。它为何如此引人关注?结果发现,它与偏微分方程、数论、几何学、组合学中的许多问题都有着惊人的关联。例如,在波传播中,你泼洒一些水,就会产生水波,它们会向各个方向传播。但波既展现粒子行为,也展现波动行为。所以你可以得到所谓的波包,它就像一种高度局域化的波,在空间上局域化,并随时间向某个特定方向移动。因此,如果你在空间和时间上绘制它,它会占据一个看起来像管状的区域。 陶哲-轩: 因此,可能发生的情况是,你可以有一个最初非常分散的波,但在时间稍后,它会全部聚焦于一个单点。你可以想象将一颗石子投入池塘,波纹会扩散开来。但如果你对那个场景进行时间反演,并且波动方程是时间可逆的,你就可以想象波纹汇聚到一个单点,然后发生一次巨大的飞溅,甚至可能是一个奇点。因此,这样做是可能的。从几何学上来说,正在发生的是总是存在某种光线。因此,例如,如果这个波代表光,你可以将这个波想象成以光速传播的光子的叠加。它们都沿着这些光线传播,并且都聚焦于这一个点。 陶哲轩: 因此,你可以使一个非常分散的波在空间和时间上的一个点聚焦成一个高度集中的波,但随后它会再次散焦并分离。但潜在地,如果这个猜想有一个负解,这意味着存在一种非常有效的方式,可以将指向不同方向的管状物打包到一个体积非常非常狭窄的区域中,那么你也能够创造出始于...的波。会有某种波的排列,它们一开始非常非常分散,但它们不会只集中在一个点上,而是在空间和时间上会有大量的集中点。并且你可以创造出所谓的“解的爆破”现象,即这些波的振幅变得如此之大,以至于它们所遵循的物理定律不再是波动方程,而是更复杂和非线性的东西。 陶哲轩: 因此在数理物理中,我们非常关心波动方程中的某些方程是否稳定,以及它们是否能产生这些奇点。有一个著名的未解决问题,叫做纳维-斯托克斯方程正则性问题。纳维-斯托克斯方程是支配流体或像水这样的不可压缩流体的方程。这个问题问道,如果你从一个水的光滑速度场开始,它是否会集中到如此程度,以至于在某个点上速度变为无限大?那被称为一个奇点。我们在现实生活中没有看到过这种情况。如果你在浴缸里泼水,水不会在你身上爆炸,也不会以光速飞溅出去,但潜在地它是可能发生的。事实上,近年来,共识已倾向于认为,对于例如水的某些非常特殊的初始配置,奇点确实可以形成。但人们尚未能真正证实这一点。克莱数学研究所提出了这七个千禧年大奖难题,解决其中一个难题将获得一百万美元的奖金。这是其中一个。在这七个问题中,目前只有庞加莱猜想已被解决。 陶哲轩: 因此,卡凯亚猜想与纳维-斯托克斯问题并非直接相关,但理解它将有助于我们理解诸如波集中等方面的某些现象,这间接地可能会帮助我们更好地理解纳维-斯托克斯问题。 莱克斯: 您能谈谈纳维-斯托克斯问题吗?嗯,就是像您所说的,它的存在性与光滑性,一个千禧年大奖难题。是的。您在这个问题上取得了很大进展。2016年,您发表了一篇论文,名为《三维平均纳维-斯托克斯方程的有限时间爆破》。那么,我们正在努力弄清楚这东西通常是否不会爆炸。对。但我们能确定地说它永不爆炸吗? 陶哲轩: 对。嗯。那么,嗯,那确实是百万美元的问题。嗯。那么,这就是数学家与几乎所有其他人不同的地方。比如说,如果某件事百分之99.99的时候都成立,那么对于大多数情况来说,这已经足够了。但数学家是少数真正关心是否所有情况,比如百分之百,真正百分之百的所有情况都被涵盖的人。所以,大多数流体,在大多数时候,水不会爆炸。但是,你是否能设计一个非常特殊的初始状态来导致这种情况发生呢? 莱克斯: 也许我们应该说,这是一组在流体力学领域中起支配作用的方程,旨在理解流体的行为方式。实际上,结果发现它确实非常复杂,你知道,流体,是的,是一种极其复杂难以建模的事物。 陶哲轩: 是的。所以,它具有实际重要性。因此,这个克雷奖问题涉及被称为不可压缩纳维-斯托克斯方程(组)的理论,该理论支配着像水这样的物质的行为。还有一种叫做可压缩纳维-斯托克斯方程(组)的理论,它支配着像空气这样的物质的行为。而这对于天气预报尤为重要。天气预报中包含大量的计算流体力学应用。很多时候,它实际上就是尽其所能地试图求解纳维-斯托克斯方程。还需要收集大量数据,以便他们能够初始化方程。这牵涉到很多方面。所以,这是一个非常重要的实际问题。 陶哲轩: 简短的回答是麦克斯韦妖。那么,麦克斯韦妖是热力学中的一个概念。比如,如果你有一个装有两种气体——氧气和氮气的盒子,你可能一开始让所有氧气在一边,氮气在另一边,但它们之间没有屏障,那么它们就会混合。而且它们应该保持混合状态。没有理由说明它们会分离。但是,原则上,由于它们之间所有的碰撞,可能会有一种奇怪的阴谋,也许存在一个被称为麦克斯韦妖的微观妖魔,它会在每次氧原子和氮原子碰撞时,使它们以这样一种方式反弹:氧原子会漂移到一边,而氮原子则去到另一边。这样就可能出现一种我们从未见过的极不可能的配置。从统计学上讲,这是极不可能的。但从数学上讲,这可能发生,我们不能排除这种可能性。 陶哲-轩: 这种情况在数学中经常出现。一个基本例子是圆周率的数字,3.14159 等等。这些数字看起来没有规律,我们也相信它们没有规律。从长远来看,1、2 和 3 的出现次数应该与 4、5 和 6 的出现次数一样多。圆周率的数字不应该有任何偏好,例如偏爱 7 而非 8。但也许圆周率的数字中存在某种妖魔,每当你计算出越来越多的数字时,它就会某种程度上偏向某个数字。而这是一种本不应发生的诡异现象。它没有理由发生,但以我们当前的技术无法证明。 陶哲轩: 好的,那么回到纳维-斯托克斯方程,流体具有一定量的能量。而由于流体处于运动状态,能量会随之传输。水也具有黏性。因此,如果流体分布在许多不同位置,流体的固有黏性就会耗散能量,使其趋于零。这正是我们实际用水进行实验时发生的情况。你泼洒时,会产生一些湍流和波浪等等,但最终它会平静下来。而且振幅越小,速度越小,它就越平静。 陶哲轩: 但潜在地存在某种“恶魔”,不断将流体的能量推向越来越小的尺度。它会移动得越来越快。速度越快,黏度效应相对越小。因此,可能会出现一种所谓的自相似爆发情景,即流体的能量从某个大尺度开始,然后将其全部能量传递到一个更小的流体区域,接着以更快的速度进入一个甚至更小的区域,依此类推。每次发生这种情况,所需时间可能只有上一次的一半。然后,能量实际上可以在有限时间内会聚到一点。这种情景被称为有限时间爆发。 陶哲-轩: 那么在实践中,这种情况不会发生。所以水是所谓的湍流。确实如此,如果你有一个大的水涡流,它会倾向于分解成更小的涡流。但它不会将所有能量从一个大涡流传递到一个小涡流。它可能会转化为三到四个。然后那些又分裂成各自可能的三到四个小涡流。因此能量会分散到粘度能够控制住一切的程度。但是,如果它能以某种方式集中所有能量,将它们全部聚集在一起,并且进行得足够快,使得粘性效应没有足够时间使一切平静下来,那么这种爆裂现象就可能发生。 陶哲轩: 因此,有些论文声称,哦,你只需要考虑能量守恒,并谨慎地利用粘度,就可以控制住一切,不仅是纳维-斯托克斯方程,还包括许多许多这类方程。因此,过去曾有许多尝试来获得纳维-斯托克斯方程的所谓全局正则性,这与有限时间爆裂相反,意味着速度保持光滑。然而,所有这些尝试都失败了。总会出现一些符号错误或微妙的失误,并且无法挽救。 陶哲轩: 所以我感兴趣的是尝试解释为什么我们无法反驳有限时间爆裂现象。我无法对实际的流体方程进行这项工作,因为它们太复杂了。但是,如果我能对纳维-斯托克斯运动方程进行平均化处理,也就是说,如果我能关闭某些类型的水相互作用方式,只保留我想要的。具体来说,如果存在流体,并且它能将能量从一个大涡流传递到这个小涡流或另一个小涡流,我就会关闭会将能量传递给这个涡流的能量通道,只将其导向这个更小的涡流,同时仍保留能量守恒定律。 陶哲轩: 对。所以它提供了数学中所谓的“障碍”。所以我所做的,基本上是,如果我关闭了方程的某些部分,这通常会在你关闭某些相互作用时,使其非线性程度降低,变得更正则,更不容易爆破。但我发现,通过关闭一组精心设计的相互作用,我能迫使能量在有限时间内爆发。这意味着,如果你想证明纳维-斯托克斯方程(即真实方程)的整体正则性,你必须利用真实方程的某些特性,而我的构造方程并不满足这些特性。因此,这排除了某些方法。 陶哲轩: 数学的一个特点是,它不仅仅是找到或采用一种行之有效并加以应用的技术,而是你需要避免采用那些行不通的技术。对于那些真正困难的问题,你常常会想到几十种可能适用于解决问题的方法。但只有在积累了大量经验之后,你才会意识到这些方法根本行不通。因此,对于邻近问题拥有这些反例,在某种程度上排除了(某些方法)。它为你节省了大量时间,因为你不会再把精力浪费在你现在已知绝不可能奏效的事情上。 陶哲轩: 没错,是的。我的技术利用的关键现象是所谓的超临界性。在偏微分方程中,这些方程常常是不同力之间的一场拔河。在纳维-斯托克斯方程中,存在源于粘性的耗散力,它已被充分理解。它是线性的,能使事物平息下来。如果只有粘性存在,那么就永远不会发生任何不好的事情。但也存在输运效应,即空间某一位置的能量会因为流体运动而被输运到其他位置。 陶哲轩: 因此,纳维-斯托克斯方程中有两个相互竞争的项:耗散项和输运项。如果耗散项占主导,如果它很大,那么基本上就会得到正则性。如果输运项占主导,那么我们就不知道会发生什么了。这是一个非常非线性的局面。它是不可预测的。它是湍流的。因此,有时这些力在小尺度上处于平衡,但在大尺度上却不平衡,反之亦然。所以纳维-斯托克斯方程是所谓的超临界方程。因此,在越来越小的尺度上,输运项远强于黏性项。所以黏性项是使事物平静下来的因素。 陶哲轩: 这就是为什么这个问题在二维空间中很难。苏联数学家奥尔加·拉德任斯卡娅在20世纪60年代表明,在二维空间中不存在爆破。而在二维空间中,纳维-斯托克斯方程是所谓的临界方程。输运效应和粘性效应的强度大致相同,即使在非常非常小的尺度上也是如此。我们有很多技术来处理临界和次临界方程,并证明其正则性。但对于超临界方程,情况尚不清楚。 陶哲轩: 我做了大量工作,随后也有许多后续研究表明,对于许多其他类型的超临界方程,你可以创建各种爆裂例子。一旦非线性效应在小尺度上主导了线性效应,就会出现各种糟糕的情况。因此,这是这项研究的主要见解之一,即超临界性与临界性和次临界性之间存在巨大差异。 陶哲轩: 我的意思是,这是一个关键的定性特征,它区分了一些方程,使它们表现得良好且可预测,比如行星运动。我的意思是,有些方程你可以预测数百万年,或者至少数千年。再说,这并非真正的问题。但我们无法预测两周以后天气的原因是,它是一个超临界方程。许多非常奇怪的事情正在极小的尺度上发生。 陶哲-轩: 是的,如果非线性在小尺度上不知何故变得越来越显著和有趣。我的意思是,有许多方程是非线性的,但在许多方程中,你可以通过整体来近似事物。例如,行星运动,如果你想了解月球或火星等的轨道,你并不真正需要了解月球地震学的微观结构或者质量究竟是如何分布的。你可以将这些行星近似为质点。而只有整体行为才重要。但是如果你想模拟流体,比如天气,你不能只说在洛杉矶,温度是多少,风速是多少。对于超临界方程,最精细的确认确实非常重要。 莱克斯: 如果我们能稍微深入探讨一下纳维-斯托克斯方程。你曾提出,或许你可以描述一下,解决它的方法之一,或者说以负面方式解决它的方法之一,将是构建一个液体,一种液态计算机。然后展示计算理论中的停机问题对流体动力学有影响。所以以此方式展示。你能描述一下这个想法吗? 陶哲轩: 对。嗯。这源于构建这个失控的平均方程的工作。所以作为我必须做这件事的一部分,有一种朴素的方法来做这件事。你只是不断地推动。每当你在一个尺度上获得能量时,你立即尽可能快地将其推向下一个尺度。这是一种强制性地造成发散的朴素方法。结果发现在五维及更高维度中,这确实有效。但在三维空间中,我发现了一种奇特的现象。那就是如果你改变物理定律,你总是试图将能量推向越来越小的尺度。结果是能量开始同时扩散到许多尺度上。所以你在一个尺度上拥有能量,你把它推向下一个尺度,然后一旦它进入那个尺度,你也会把它推向下一个尺度,但前一个尺度上仍然有一些能量残留。你试图同时完成所有事情。而这使得能量扩散得过于分散。结果发现,这使得它更容易受到粘性的影响,进而将一切都阻尼耗散掉。因此,事实证明这种直接方法实际上并不可行。还有一篇由其他作者撰写的论文,实际在三维空间中展示了这一点。 陶哲轩: 所以我需要做的就是编程一个延迟,有点像气闸。所以我需要一个方程,它会从流体在某个尺度上发生作用开始,将这种能量推入下一个尺度,但能量会停留在那里,直到所有来自更大尺度的能量都转移完毕。只有在你将所有能量都推入之后,你才能打开下一个“门”,然后也将它推入。通过这样做,能量逐个尺度地缓慢向前移动,使得它一次只局限在一个尺度上。这样它就能抵抗黏性效应,因为它没有被分散。 陶哲轩: 如果你想要一个能做某事的电路,比如让灯光闪烁、亮灭交替,你可以用更原始的元件,比如电容器、电阻器等来构建它。你必须绘制一个图表。通过这些图表,你可以凭肉眼跟踪,然后说,哦,电流会在这里积累,然后停止,再然后它会那样做。所以我知道如何构建基本电子元件的模拟物,比如电阻器和电容器等等。我会将它们堆叠起来,以创造出能打开一个门的装置,然后会有一个计时器。然后一旦计时器达到某个阈值,它就会将其关闭。它有点像鲁布·戈德堡式的机器,但却是用数学方式描述的。结果这最终奏效了。 陶哲轩: 所以我意识到,如果你能对实际方程实现同样的事情,也就是说如果水的方程支持计算,那么你就可以想象一种蒸汽朋克,但它实际上是一种水朋克类型的东西,你知道,现代计算机是电子的,它们由电子通过非常微小的导线并与其他电子相互作用等来供电。但你可以想象这些水脉冲以一定的速度移动,而不是电子。也许存在两种不同的配置,分别对应着一位(比特)的向上或向下状态。如果让两个这样的移动水体相撞,它们可能会产生某种新的配置,类似于一个与门或或门。输出将以一种高度可预测的方式取决于输入。你可以将它们串联起来,或许就能创造出一台图灵机。这样你就能拥有完全由水构成的计算机了。 莱克斯: 如果你拥有计算机,那么也许就能实现机器人技术、液压技术等等。这样你就可以创造出一种机器,它基本上是流体模拟的,也就是所谓的冯·诺依曼机器。 陶哲轩: 冯·诺依曼提出,如果你想殖民火星,仅仅是运送人员和机器到火星的成本,就已高得荒谬。但如果你能将一台机器运送到火星,而这台机器有能力开采行星、制造更多材料、冶炼它们并建造更多相同的机器副本,那么随着时间的推移,你就能殖民整个行星。所以如果你能建造一台流体机器,它就是一台流体机器人。它的作用,它存在的目的,是它被编程为会以某种“冷”状态创造出自身的更小版本。它暂时不会启动。一旦准备就绪,这个配置好的水体形态的大机器人会将其所有能量转移给更小的配置体,然后关闭。然后它会自行清理。然后剩下的就是这种最新的状态,它会随后启动并做同样的事情,但更小、更快。然后这个方程具有某种尺度对称性。一旦你这样做,它就可以不断迭代。 陶哲轩: 所以,原则上,这会为实际的纳维-斯托克斯方程创造一个爆破。而这正是我为这个平均纳维-斯托克斯方程设法完成的。所以它提供了这样一种解决问题的路线图。这现在是痴心妄想,因为要实现这个目标,还有很多东西缺失。所以我无法创建这些基本逻辑门。我没有这些水的特殊配置。我的意思是,有包括涡环在内的候选方案可能有效。但同时,你知道,模拟计算比数字计算要糟糕得多,因为它总是存在误差。你在过程中必须进行大量的纠错。我不知道如何完全关闭这台大机器,使其不干扰小型机器的运行。但原则上,一切皆有可能。这不与任何物理定律相矛盾。所以这可以算作这种事物是可能的一种证据。还有其他一些研究小组正在探寻使纳维-斯托克斯方程爆破的方法,这些方法远没有我刚才描述的这么荒谬地复杂。他们实际上正在追求更接近于直接的自相似模型,该模型目前还不能直接生效,但可能存在比我刚才描述的更简单的方案来使其奏效。 莱克斯: 从纳维-斯托克斯方程到这台图灵机,这其中确实存在着天才般的飞跃。所以,它从你试图获得越来越小的自相似斑点情景,转变为现在拥有一个越来越小的液体图リング机,并设法探究这如何能够用来解释爆破现象。 陶哲轩: 我的意思是,那是一个巨大的飞跃。因此,存在先例。我的意思是,数学的特点在于它非常擅长找出你可能认为完全不同的问题之间的联系。但如果数学形式相同,你就可以建立联系。因此,之前有很多关于所谓细胞自动机的工作,其中最著名的是康威生命游戏。这是一个无限的离散网格,在任何给定时间,网格要么被一个细胞占据,要么是空的。细胞如何演化,遵循着一个非常简单的规则。因此,细胞有时存活,有时死亡。我还是学生时,让这些动画持续运行是一个非常流行的屏幕保护程序。它们看起来非常混沌。事实上,它们有时有点像湍流。 陶哲轩: 但在某个时候,人们在“生命游戏”中发现了越来越多有趣的结构。例如,他们发现了一种叫做“滑翔机”的东西。滑翔机是一种非常微小的、由四五个细胞组成的构型,它会演化并朝某个方向移动。那就是这个涡环。所以这是一个类比。康威生命游戏可以看作是一种离散方程,而流体纳维-斯托克斯方程则是一种连续方程。但从数学角度来看,它们具有一些相似的特性。 陶哲轩: 随着时间的推移,人们在康威生命游戏中发现了越来越多可以构建的有趣事物。康威生命游戏是一个非常简单的系统。它只有三到四个规则,但你可以在其中设计出各种有趣的结构。有一种叫做滑翔机枪的东西,它只会一个接一个地吐出滑翔机。经过大量努力,人们成功地为滑翔机创建了与门和或门。有这样一个庞大而令人难以置信的结构,如果你有一股滑翔机流从这里进入,另一股滑翔机流也从这里进入,那么它就可能会产生一股滑翔机流作为输出。也许只有当两股滑翔机流都包含滑翔机时,才会有输出流。但如果只有其中一股有,那么什么也出不来。所以他们可以建造类似那样的东西。一旦你能够建造这些基础门,那么仅仅从软件工程的角度,你几乎可以建造任何东西。你可以建造一台图灵机。我的意思是,它就像一个巨大的蒸汽朋克式装置。它们看起来很荒谬。 陶哲轩: 但后来人们在生命游戏中也生成了自我复制的物体。一台巨大的机器,一台二项式机器,它在漫长的时间里,内部总有小型的滑翔子枪进行着这些非常蒸汽朋克式的计算,它会创造出自身的另一个版本,这个版本能够自我复制。这真是令人难以置信。实际上,其中很多都是由业余数学家通过社区众包完成的。所以我对那项工作有所了解。因此,这也是我提出对纳维-斯托克斯方程做同样事情的部分灵感来源。模拟远不如数字。你不能直接拿“生命游戏”中的构造并照搬过来。但话又说回来,这只表明它是可能的。 莱克斯: 你知道,这些元胞自动机中会发生某种涌现现象。局部规则,也许与流体类似,我不知道,但大规模运行的局部规则可以创造出这些极其复杂的动态结构。你认为其中任何一部分适合进行数学分析吗?我们有工具对此进行深入阐述吗? 陶哲轩: 问题是,你可以获得这种涌现的、非常复杂的结构,但只有在初始条件经过非常精心准备的情况下才行。所以这些滑翔机枪、逻辑门和软件机器,如果你只是随机地在“生命游戏”中放置一些细胞,你将看不到任何这些东西。这就是与纳维-斯托克斯方程再次类比的情况。在典型的初始条件下,你不会遇到任何这种奇怪的计算。但基本上,通过工程设计,以非常特殊的方式专门设计事物,你可以做出巧妙的构造。 陶哲轩: 这是数学中一个反复出现的挑战,我称之为结构与随机性之间的二元对立。即你在数学中生成的大多数对象都是随机的。它们看起来是随机的,比如圆周率的各位数字。嗯,我们认为这是一个很好的例子。但只有极少数事物具有模式。你可以通过构造它来证明某物具有模式。如果某物具有简单的模式,并且你有一个证明表明它会每隔一段时间重复自身,你就可以做到这一点。你可以证明大多数数字序列没有规律。如果你只是随机选取数字,有一个称为大数定律的法则告诉你,从长远来看,你得到的一的数量会和二的数量一样多。 陶哲轩: 如果我给你一个特定的模式,比如圆周率的数字,我如何才能证明它不包含某种奇怪的模式呢?我投入大量时间从事的另一项工作是证明所谓的结构定理或逆定理,这些定理提供了检验某物何时具有很强结构性的方法。 陶哲轩: 因此,有些函数被称为加性的。比如你有一个将自然数映射到自然数的函数,所以二可能映射到四,三映射到六,依此类推。有些函数被称为加性的,这意味着如果你将两个输入相加,输出也会相应地相加。例如,我正在乘以一个常数。如果你将一个数字乘以10,如果你将a加b的结果乘以10,这等同于将a乘以10,将b乘以10,然后再将它们相加。因此,有些函数是可加的。 陶哲轩: 有些函数是近似可加的,但不是完全可加的。举例来说,如果我取一个数字n,将其乘以2的平方根,然后取其整数部分。所以10乘以2的平方根大约是14点几。因此10变成了14,20变成了28。所以在这种情况下,可加性是成立的。因此10加10是20,而14加14是28。但由于这种取整,有时会出现舍入误差。有时当你将a加b时,这个函数不能完全给出两个单独输出的总和,而是总和加一或减一。所以它几乎是可加的,但并非完全可加。 陶哲轩: 所以在数学中有许多有用的结果,而我也在很大程度上致力于发展这类理论,其大意是,如果一个函数展现出某种结构,那么它基本上……它之所以成立是有原因的。而原因在于,存在某个与之相关的函数是完全有结构的,它解释了你所观察到的这种局部模式。 莱克斯: 因此,如果你拥有这些逆定理,它就会形成一种二分法:你所研究的对象要么完全没有结构,要么以某种方式与有结构的事物相关联。 陶哲轩: 无论哪种情况,你都能取得进展。一个很好的例子是,数学中有一个经典定理,叫做塞迈雷迪定理,它在1970年代被证明。它涉及在一个数集中寻找某种类型的模式。这些模式必须形成等差数列,例如3、5和7,或者10、15和20。塞迈雷迪证明,任何足够大的数集,即所谓具有正密度的数集,都包含你想要的任意长度的等差数列。 陶哲轩: 例如,奇数集合的密度为二分之一,并且它们包含任意长度的等差数列。在那种情况下,这显而易见,因为奇数非常有结构性。我可以只取11、13、15、17。我可以轻易地在该集合中找到等差数列。但塞迈雷迪定理也适用于随机集合。如果我取奇数集合,然后对每个数字抛一次硬币,我只保留那些我抛出正面的数字。好的,我只是抛硬币,我只是随机取出半数数字,我保留一半。所以这是一个根本没有任何模式的集合。但仅仅从随机波动中,你仍然会在那个集合中得到很多等差数列。 陶哲轩: 你听说过无限猴子定理吗?通常,数学家给定理起的名字都很无趣,但偶尔他们也会起一些生动的名字。无限猴子定理的通俗说法是,如果你有无限数量的猴子,每只猴子一台打字机,它们可以随机敲出文本。几乎可以肯定,其中一只猴子将会敲出《哈姆雷特》的全部内容,或任何其他有限的文本串。这只是需要一些时间,实际上是相当长的时间。但如果你有无限的数量,那么它就会发生。所以基本上,该定理指出,如果你取一个无限长的数字串或其他什么,最终你想要的任何有限模式都将出现。这可能需要很长时间,但它最终会发生。尤其地,任何长度的等差数列最终都会出现,但这需要一个极其长的随机序列才能实现。 莱克斯: 现实生活中没有什么是真正无限的,但你可以问自己这样的问题:如果我想要多少钱就有多少钱,或者如果我想跑多快就跑多快,那会怎样? 陶哲轩: 数学家将此形式化的方法是:数学找到了一个形式体系,可以理想化地将某个极其大或极其小的量,精确地变为无穷大或零。通常,当你这样做时,数学会变得简洁很多。在物理学中,我们开玩笑说假设球形奶牛。现实世界的问题存在各种实际效应,但你可以将其理想化,将某些量推向无穷大,将另一些量推向零,这样数学处理起来就会简单得多。 陶哲轩: 是的,所以有很多陷阱。我们在本科数学课上花费大量时间教授分析学,而分析学通常是关于如何取极限的。例如,a加b总是等于b加a。因此,当你拥有有限项时,你可以把它们加起来,也可以交换它们的顺序,没有任何问题。但是,当你拥有无限项时,你就可以玩弄这些花招,一个级数可能收敛于一个值,但你重新排列它,它却突然收敛到另一个值。所以你可能会犯错误。当你允许使用无穷概念时,你必须清楚自己在做什么。你必须引入这些ε和δ,而且有一种特定的推理方式可以帮助你避免错误。 陶哲轩: 近些年,人们开始将那些在无限极限下成立的结果进行所谓的有限化处理。所以你最终会知道某件事是真的,但你不知道是何时。现在给我一个速率。那么,如果我没有无限数量的猴子,而是大量的有限数量的猴子,我需要等多久《哈姆雷特》才能出现?那是一个更具定量性质的问题。而这是你可以纯粹通过有限方法来处理的问题,并且你可以运用你的有限直觉。在这种情况下,结果表明它与你试图生成的文本长度呈指数关系。这就是为什么你从来看不到猴子创作出《哈姆雷特》。你也许能看到它们创造出一个四个字母的单词,但绝没有那么大的作品。所以我个人认为,一旦你将一个无限的陈述有限化,它就会变得更直观,也不再那么奇怪了。 陶哲轩: 是的。不利之处在于,有限化证明要混乱得多。因此,无限的证明通常会先被发现,通常会早几十年,然后人们再将它们有限化。 莱克斯: 既然我们提到了很多数学和物理,那么作为学科,作为理解世界、看待世界的方式,数学和物理之间有什么区别呢?也许我们可以把工程学也加进去。你提到你的妻子是一名工程师。这为电路提供了新的视角。那么,鉴于你从事过数理物理学,你看待世界的方式就有所不同。你身兼多职。 陶哲轩: 没错。那么,我认为科学总的来说是三者之间的相互作用。一是真实世界,二是我们对真实世界的观察,即我们的观测结果,然后是我们关于世界如何运作的心理模型。因此,我们无法直接接触现实。我们所拥有的只有那些不完整且存在误差的观测结果。并且在许多许多情况下,我们可能想知道,例如,明天的天气如何?而我们尚未获得我们希望预测的观测结果。然后我们有这些简化模型,有时会做出不切实际的假设,你知道,就像球形奶牛之类的东西。那些就是数学模型。 陶哲轩: 数学关注的是模型。科学收集观测结果,并提出可能解释这些观测结果的模型。数学所做的是,我们停留在模型之内,并询问该模型会产生什么结果?模型会针对未来的观测或过去的观测做出什么样的观测结果,什么样的预测?它符合观测数据吗?所以,这确实是一种共生关系。我想数学在其他学科中是独特的,因为我们从假设开始,比如一个模型的公理,然后询问从该模型中能得出什么结论。在几乎所有其他学科中,你都是从结论开始,比如我想做这个,我想建一座桥,我想赚钱,我想做这个,然后你找到实现目标的路径。很少有人会推测“假设我这样做,会发生什么?”规划与建模。也许,科幻小说是另一个特例。但实际上,也就这些了。我们生活中所做的大多数事情都是结果导向的,包括物理学和科学。我的意思是,他们想知道这颗小行星会去哪里?明天的天气会怎样?但数学也有另一个方向,那就是从公理出发。 莱克斯: 你认为,在物理学中,理论与实验之间存在着这种张力。你认为哪种方式更能有效地发现关于现实的真正新颖的想法? 陶哲轩: 嗯,你需要两者兼备,自上而下和自下而上。这实际上是所有这些事物之间的相互作用。因此,随着时间的推移,观测、理论和建模都应该更接近现实。但最初,情况总是如此,它们一开始总是相距甚远,但你需要其中一个来弄清楚如何推动另一个。如果你的模型预测到实验未能发现的异常,这会指示实验人员去哪里寻找更多数据,以完善模型。这是一个反复往复的过程。 陶哲轩: 在数学本身内部,也存在理论和实验的组成部分。只不过,直到最近,理论才几乎完全占据主导地位。99% 的数学是理论数学,而实验数学的数量非常少。人们确实在做。如果他们想研究质数或类似的东西,他们可以生成大量数据集。所以一旦我们有了计算机,我们就开始做了一点。尽管甚至在高斯之前,例如,他猜想了数论中最基本的定理,称为质数定理,该定理预测了从一百万到一万亿有多少个质数。这不是一个显而易见的问题。基本上,他所做的是,主要靠自己计算,但也雇佣了人工计算员——那些以算术计算为专业工作的人——来计算前100,000个质数或类似数字,并制作了表格,做出了预测。那是实验数学的一个早期例子。 陶哲轩: 但直到最近,理论数学一直要成功得多。当然,直到最近,进行复杂的数