AI时代经验主义悖论
从Erdős #1196事件看人类知识进化惯性的结构性困境
The Empiricism Paradox in the Age of AI:
Structural Inertia of Human Knowledge Evolution Through the Lens of Erdős Problem #1196
2026年4月,23岁的业余数学家Liam Price通过一次ChatGPT提示,在80分钟内解决了困扰数学界近60年的Erdős问题#1196。AI没有沿用人类90年来的概率论传统路径,而是从完全不同的算术方向——von Mangoldt函数与马尔可夫链——找到了解答。本文以此事件为起点,提出”AI时代经验主义悖论”这一认识论概念:人类知识传承在积累有效经验的同时,也系统性地固化了由历史生产力约束所塑造的路径依赖。这些”妥协理论的有效性”在约束条件改变后仍被当作真理传承,形成了知识图谱中海量的”进化惯性错误路径”。AI的价值不仅在于计算力,更在于它是人类历史上第一个不携带路径依赖惯性的认知系统,能够系统性地暴露被经验主义遮蔽的替代可能性。
第一章
引言:一个23岁年轻人的80分钟
Introduction: 80 Minutes by a 23-Year-Old
2026年4月的某个周一下午,一位名叫Liam Price的23岁年轻人,将一道数学问题输入了ChatGPT GPT-5.4 Pro。他不知道这道题的历史,不知道它困扰了数学界多久,不知道有多少专家在上面耗费了数十年心血。他只是像平时一样,随手从Erdős问题网站上挑了一道题,交给AI看看会发生什么。
80分钟后,GPT-5.4 Pro返回了一份证明。这份证明的文字质量”相当差”——斯坦福大学数学家Jared Lichtman如此评价。但当Lichtman和菲尔兹奖得主陶哲轩仔细审读后,他们意识到:这份粗糙的输出中包含了一个前所未有的数学洞察。
Lichtman本人是这个领域最顶尖的专家——他花了四年证明了Erdős原始集猜想,又花了七年追击同一家族中的下一个开放问题。读完GPT的证明后,他写道:这是一个”天书证明”(Book Proof)——这是保罗·埃尔德什对最优美证明的最高赞誉。
陶哲轩则指出,这个证明揭示了整数结构与马尔可夫过程理论之间“此前未被描述的联系”。他说:”我们发现了一种关于大数及其结构的全新思考方式。”
这个事件本身已经足够惊人。但本文要追问的不是”AI能不能做数学”这个表面问题,而是它背后隐藏的一个更深层的认识论命题:为什么一个没有任何数学训练的人,配合一个没有任何路径偏见的AI,能解决所有专家集体失败了60年的问题?
第二章
事件解剖:90年的集体弯路
Anatomy of the Event: A 90-Year Collective Detour
要理解这个事件的深层含义,我们首先需要理解问题本身及其历史。
2.1 什么是原始集与Erdős和
原始集(primitive set)是大于1的整数组成的集合,其中没有任何一个数能整除另一个数。例如,素数集{2, 3, 5, 7, 11, …}就是一个原始集。对于任何原始集A,可以计算一个”分数”——Erdős和:f(A) = Σ 1/(a·log a),对集合中的每个元素a求和。
1935年,保罗·埃尔德什证明了一个令人惊讶的结果:这个和对所有原始集都是有界的。这意味着,一个看似纯粹组合性的条件——”没有元素整除另一个元素”——竟然强制施加了一个分析约束。
1988年,埃尔德什进一步猜想:这个上界在素数集处取到最大值(约1.6366)。2022年,Lichtman在博士论文中证明了这一猜想。
2.2 问题#1196:渐近极值性
埃尔德什还注意到:如果原始集的元素都很大,Erdős和会变小。1968年,他与沙尔科齐、塞梅雷迪一起猜想:当元素趋向无穷时,Erdős和的上确界趋向1。这就是问题#1196。
Lichtman此前已经证明了一个较弱的上界——约1.399加一个趋于零的误差项。这是很强的工作,但不是最终答案。GPT-5.4 Pro则给出了精确的渐近结果:1+O(1/log x)。
2.3 关键差异:路径,而非终点
真正令数学界震惊的不是结果本身,而是到达结果的路径。
“自1935年以来,每一位研究这个问题的数学家都采用了同一条路线:将问题从数论转化为概率论。这种做法对人类思维来说太自然了,以至于没人去寻找替代方案。”
GPT-5.4 Pro没有走这条路。它留在算术领域,使用了von Mangoldt函数——一个在解析数论中已经存在了90年的经典工具,但从未有人想到将其应用于原始集问题。它还引入了一种马尔可夫链方法,建立了整数结构与随机过程之间此前未被发现的联系。
Greg Brockman引用了一个精确的类比:“最接近的类比是:国际象棋的主要开局已经被充分研究,但AI发现了一条被人类美学和惯例所忽视的新开局线路。”
第三章
AI时代经验主义悖论
The Empiricism Paradox in the Age of AI
基于上述事件,我们提出“AI时代经验主义悖论”这一核心概念。其内涵可以表述如下:
人类文明的全部进步建立在经验积累和知识传承之上。但经验积累的过程同时也是搜索空间坍缩的过程——每一代人继承前人的成果,也继承了前人的方向,最终所有专家都拥挤在同一条越走越窄的隧道里。知识越深,盲区越系统化;传统越成功,替代路径越不可见。
这个悖论有一个极其浓缩的表达:“站在巨人肩上的副作用,就是按巨人的方向看世界。”
牛顿的名言”如果我看得更远,那是因为我站在巨人的肩上”被视为知识传承的最高隐喻。但它遗漏了一个关键的暗面:站在巨人肩上,你确实看得更远,但你只能看巨人面朝的那个方向。巨人身后的整个视野,对你来说是不可见的——不是因为那里没有风景,而是因为你的位置本身决定了你的视角。
Erdős #1196事件完美地展示了这一点。Lichtman不是不聪明——恰恰相反,他是地球上最了解这个问题的人。但正是这种了解本身构成了他的囚笼。他站在埃尔德什1935年画下的那条从数论到概率论的路径上,所有后来者都站在他的肩上,于是所有人都沿着同一个方向看。90年,没有一个人回头。
3.1 与库恩范式理论的关系:继承与超越
读者可能已经注意到,经验主义悖论与托马斯·库恩1962年在《科学革命的结构》中提出的范式理论存在深刻的共鸣。库恩认为,科学进步不是线性的知识积累,而是”常规科学”与”科学革命”的交替循环。在常规科学期间,科学家在主导范式内解决”谜题”;当异常积累到临界点时,范式危机引发革命,新范式取代旧范式。
经验主义悖论与库恩的范式理论共享同一个核心洞察:科学知识不是中性的、不断积累的事实集合,而是被特定框架所塑造的、具有方向性和局限性的人类建构。库恩将此称为”理论负载性”(theory-ladenness)——科学家可能根据流行理论以不同方式解释同一现象。
但经验主义悖论超越了库恩的框架,体现在三个关键维度:
库恩关注的是范式如何运作、如何转换。经验主义悖论追问的是更上游的问题:范式为什么会形成这种特定的形状?答案是:因为范式是特定生产力约束下的妥协产物。这将范式理论从科学社会学推进到了历史唯物主义层面。
在库恩的框架中,范式转换依赖于异常的积累和”非凡研究”的出现——本质上是一个随机过程,没有人能预测何时会发生范式革命。经验主义悖论则指出,AI的出现提供了一种系统性检测路径依赖的可能——不需要等待异常积累,而是主动扫描知识图谱中被惯性锁死的区域。
马克斯·普朗克曾尖锐地指出:”一个新的科学真理不是通过说服反对者使他们看到光明而获胜的,而是因为反对者最终死去了,熟悉这个真理的新一代人成长起来了。”这就是著名的”普朗克原则”——范式转换往往需要一代人的时间。但AI时代可能改变这一规律:当AI能持续地、快速地从非传统方向产出突破性成果时,专家的抵抗可能不再有一代人的缓冲期。
3.2 悖论的形式化结构
经验主义悖论可以更严格地表述为一组相互关联的命题:
命题一(经验的双刃性):经验积累在增强特定路径上的解题能力的同时,系统性地降低了发现替代路径的概率。设E为某领域的经验积累程度,P(s)为沿传统路径解题的成功概率,P(a)为发现替代路径的概率,则dP(s)/dE > 0 但 dP(a)/dE < 0。经验的边际收益是正的,但经验的边际想象力是负的。
命题二(盲区的系统性):经验积累所创造的盲区不是随机分布的,而是具有确定的结构——它们精确地集中在旧约束条件所遮蔽的替代路径上。因此,最有经验的专家恰恰是最系统性地看不到替代路径的人。
命题三(不可自察性):路径依赖所造成的盲区不可从系统内部检测到。身处某一范式中的科学家无法区分”这条路径确实是最优的”和”这条路径看起来最优是因为我的全部训练都在这条路径上”。这两种状态在主观体验中是不可区分的。
命题四(AI的结构性优势):AI作为一种不携带学科路径依赖惯性的认知系统,不受命题一至三的约束。它的搜索空间不会随”经验”的积累而坍缩,因为它的知识组织方式(高维向量空间)在拓扑上不具有人类学科体系的树状层级结构。
3.3 经验主义悖论的三重结构
将上述形式化命题翻译为更直觉的语言,经验主义悖论在每一个具体案例中都呈现为相同的三层递进结构:
特定约束条件下产生最优近似解(如1935年概率论方法)。这不是错误,而是当时的最佳选择。关键在于:选择的”最优性”是相对于约束条件的,而非相对于问题本身的。约束条件不同,最优解完全可能不同。
最优近似被传承为正统。后来者学到的不是”前人在某种约束下选择了这条路”,而是”这个问题应该这样做”。选择的偶然性被遗忘,路径的妥协性被神圣化。教科书在这一过程中扮演了关键角色——库恩精确地指出,教科书”遮蔽了革命性过程”,把范式呈现为似乎是自然而然、逻辑必然的结果。
正统培养出专家,专家的职业身份建立在正统之上,于是正统获得了自我防御机制。质疑路径等于质疑专家存在的基础,因此替代路径在社会学层面也被系统性排斥。魏格纳的大陆漂移假说被拒绝后,”年长的地质学家警告年轻研究者:任何对大陆漂移表现出兴趣的暗示都会毁掉他们的职业生涯。”——这不是科学判断,而是路径锁定的社会执行机制。
3.4 为什么”AI时代”是限定词
经验主义的悖论性质在人类历史上一直存在——库恩、普朗克、波普尔都从不同角度触碰过它。那么,为什么我们特别强调”AI时代”这个限定词?
因为AI的出现改变了悖论的后果。在前AI时代,经验主义悖论是一个”没有解药的诊断”——你可以指出专家有盲区,但你不能系统性地绕过它们。范式转换只能等待异常积累和天才个体的偶然出现。库恩所描述的”非凡研究”——”竞争性阐释的增殖、尝试一切的意愿、对不满的明确表达、对哲学和基本问题辩论的诉诸”——本质上是一种无序的、高成本的、成功率极低的搜索过程。
AI的出现第一次提供了一种低成本、可重复、可规模化的替代路径搜索能力。Price用20美元/月的ChatGPT订阅、一个周一下午的80分钟,就完成了一次专家群体60年未能完成的路径突破。这不是一个孤例——自2025年10月以来,AI工具已帮助解决了约100个Erdős问题。如果这种突破可以工业化生产,那么经验主义悖论就不再只是一个有趣的哲学观察,而成为一个可操作的知识生产策略:系统性地利用AI的无惯性特征,主动扫描人类知识图谱中被路径依赖锁死的区域。
这就是”AI时代”经验主义悖论的”AI时代”所指向的:不是悖论本身是新的,而是人类第一次拥有了对治这个悖论的工具。
3.5 经验主义有效性与经验主义悖论:阶段性互补而非对立
在此必须做出一个关键的澄清:经验主义有效性和经验主义悖论不是对立的两极,而是同一个知识生产系统的两个阶段。
2024年发表在《英国皇家学会会刊A》上的一项系统性研究,检验了超过750项重大科学发现(包括所有诺贝尔奖发现),结论是:科学进步的三个关键指标——重大发现、方法和领域——都表明科学主要是累积演进的。没有任何主要的跨领域科学方法或仪器被完全抛弃过。从伏特的电池到奥斯特发现电流产生磁场,到安培的电磁定律,到法拉第的发电机,到麦克斯韦的电磁理论,到特斯拉的交流电——每一步都是前一步的累积延伸。
这些事实不是对经验主义悖论的反驳,而是对其适用边界的界定。经验主义累积在问题的”可达域”内是高效的、不可替代的。电磁学的整个发展史就是累积进步的胜利。但当累积路径走到极限——当所有专家沿同一方向穷尽了60年仍无法突破时——恰恰说明问题已经超出了当前路径的可达域边界。这时候需要的不是否定经验主义,而是切换到经验主义悖论视角,从另一个维度寻找入口。
经验主义有效性是”路径内优化”的引擎。经验主义悖论是”路径间跳跃”的触发器。前者处理90%的科学问题,后者处理剩下10%中最关键的那些——那些被路径依赖锁死在长期无解状态的前沿问题。两者不是对抗关系,而是阶段性互补关系。
Erdős #1196恰恰是一个从”第一阶段”过渡到”第二阶段”的典型案例:概率论路径上的累积进步在Lichtman证明约1.399上界时达到了顶峰——这是经验主义有效性的胜利。但此后七年的停滞说明该路径的可达域已经被穷尽。GPT-5.4从von Mangoldt方向切入,不是否定了概率论路径的价值,而是在累积路径耗竭之后,从不同维度完成了突破。
第四章
妥协理论的有效性
The Validity of Compromise Theories
经验主义悖论的根源在于一个常被忽视的事实:人类历史上的绝大多数理论,都是当时生产力水平和物理环境制约下妥协的产物。
理论不是纯粹的真理。理论是特定生产力条件下的最优近似解。当工具有限时,人类不得不在”精确”和”可操作”之间做出妥协。这些妥协在当时是合理的、甚至是唯一可行的。问题在于,传承的过程中,妥协的背景被遗忘了,妥协的结果被当成了真理本身。
我们将这一现象命名为“妥协理论的有效性”:理论在其产生的约束条件内有效,但这种有效性会被知识传承机制不当地延伸到约束条件已经改变的新时代。
4.1 历史案例全景
以下案例展示了这一模式在人类知识史中的普遍性。我们首先给出总览,然后逐一展开分析:
| 领域 | 妥协理论 | 物理约束 | 存续时间 | 被什么打破 |
|---|---|---|---|---|
| 医学 | 体液说 | 无显微镜 | ~2000年 | 细菌理论(显微镜) |
| 医学 | 瘴气论 | 无显微镜 | ~2300年 | 细菌理论(显微镜) |
| 医学 | 放血疗法 | 无替代药物 | ~2000年 | 抗生素与现代药理学 |
| 精神医学 | 前额叶切除术 | 无精神类药物 | ~30年 | 氯丙嗪等抗精神病药 |
| 天文 | 地心说/托勒密体系 | 无望远镜 | ~1400年 | 日心说(望远镜) |
| 物理 | 以太理论 | 无精密干涉仪 | ~200年 | 迈克尔逊-莫雷实验 |
| 物理 | 热质说 | 无分子运动论 | ~100年 | 焦耳实验 |
| 化学 | 燃素说 | 无精密天平 | ~130年 | 拉瓦锡氧化理论 |
| 物理 | 牛顿力学 | 无光速级实验 | ~230年 | 爱因斯坦相对论 |
| 地质学 | 固定大陆论 | 无海底地震仪/磁力计 | ~50年 | 板块构造论 |
| 经济学 | 重商主义 | 无工业化生产力 | ~250年 | 亚当·斯密自由贸易论 |
| 生物学 | 自然发生说 | 无显微镜/无菌技术 | ~2000年 | 巴斯德实验 |
| 数学 | 概率论路径 | 人脑搜索空间有限 | 90年 | GPT-5.4 Pro |
最后一行与前面所有案例的结构完全一致:工具约束产生了路径,路径被传承为传统,传统遮蔽了替代方案,直到新工具出现才打破循环。唯一的区别在于:以前打破旧约束的都是新的物理工具(望远镜、显微镜、干涉仪),而这一次打破旧约束的是一种新的认知工具。
下面我们逐一展开关键案例的详细分析。
4.2 医学:没有显微镜的两千年
体液说是人类知识史上存续时间最长的妥协理论之一。从公元前四世纪的希波克拉底到十九世纪中叶,近两千年间,几乎全部西方医学都建立在四种体液——血液、黏液、黄胆汁、黑胆汁——的平衡理论之上。医生通过观察患者的宏观症状(发烧、出汗、呕吐、脓液流出),得出”体液失衡”的结论,然后通过放血、灌肠、催吐等方式试图”恢复平衡”。
为什么这个完全错误的理论能持续两千年?因为在没有显微镜的时代,医生能观察到的只有宏观流体现象。病毒太小,光学显微镜都无法看到——第一个病毒直到1938年才用电子显微镜被观察到。在这个约束条件下,”液体失衡导致疾病”是唯一符合可观察证据的解释。这不是愚蠢,而是在工具极限内做出的最优推理。
放血疗法是体液说最极端的实践后果。它之所以持续了两千年,是因为它有时确实让病人”感觉好转”——放血导致血压降低,产生暂时的舒适感,制造了”治愈”的假象。华盛顿在1799年临终前的16个小时内被放掉了约2.5升血液。一个错误的理论,因为偶然的正反馈(血压降低的暂时效应),被巩固了两千年。
瘴气论的故事更加诡异。公元前五世纪由希波克拉底提出,认为疾病由”坏空气”引起。这个理论在欧洲和中国同时流行了两千多年。南丁格尔基于瘴气论推动了医院清洁化改革——虽然底层机制完全错误(不是”坏空气”致病,而是细菌),但实际效果是显著的:清洁的环境确实清除了细菌的滋生环境,减少了感染。
这揭示了妥协理论最诡异的特征:它在旧约束条件内确实有效,而这种有效性反而巩固了错误的因果解释。效果的”正确”遮蔽了机制的”错误”。南丁格尔的成功让瘴气论又多延续了几十年。
4.3 精神医学:没有药物的时代
前额叶切除术(lobotomy)是妥协理论造成灾难性后果的最极端案例。1930年代,精神病院严重过度拥挤,而当时不存在任何有效的精神类药物。1940年代,科学家观察到前额叶受损的军人表现出平静、低焦虑的特征,于是形成了一个假说:前额叶导致精神疾病,切除”坏的部分”就能治愈。
葡萄牙神经学家Egas Moniz因发明这一手术获得了1949年诺贝尔奖。在美国,Walter Freeman将其推广为”冰锥手术”——用金属器具从眼眶插入切断前额叶连接。仅1949年至1952年间,约50,000人接受了这一手术。许多患者的人格和智力功能受到严重且不可逆的损害。
直到1952年,第一种抗精神病药物氯丙嗪在巴黎出现,lobotomy才迅速被淘汰。这个案例完美展示了”妥协理论的有效性”的致命逻辑:在没有替代方案的约束条件下,一个极其粗暴的方法被接受为”最优解”,甚至获得了科学界的最高荣誉。约束条件改变(药物出现)后,这个”最优解”立即被揭露为灾难。
4.4 地质学:魏格纳的半个世纪流放
1912年,德国气象学家阿尔弗雷德·魏格纳提出了大陆漂移假说:地球上的大陆曾经是一个超级大陆(盘古大陆),后来逐渐漂移分裂。他的证据极为充分——南美洲和非洲海岸线的吻合、跨大陆的化石分布、冰川划痕的方向——但他的理论被主流地质学界彻底拒绝了。
为什么?因为魏格纳无法回答一个致命的问题:什么力量能推动如此巨大的岩石板块穿越海底?他提出的机制(地球自转的离心力、潮汐力)被计算证明远远不够。英国地球物理学家Harold Jeffreys正确地指出,固体岩石不可能像犁一样”穿过”海底。
在没有海底地震仪和磁力计的时代,海洋底部是一个完全的黑箱。地质学家无法观测到洋中脊、海底扩张、磁条纹反转——这些正是大陆漂移的真正机制。魏格纳有正确的观察,但受限于时代的工具,他无法提供正确的机制。
魏格纳1930年在格陵兰探险中冻死。在他去世后的几十年里,年长的地质学家警告年轻研究者:任何对大陆漂移表现出兴趣的暗示都会毁掉他们的职业生涯。直到1960年代,从战争中发展出的地震仪(用于监测核试验)和磁力计(用于探测潜艇)被应用于海底研究,发现了洋中脊和磁条纹反转,板块构造论才在1967年成为现代地球物理学的公理。
这是路径锁定最残酷的案例:一个正确的理论被拒绝了半个世纪,不是因为证据不足,而是因为当时的工具无法揭示机制,而”无机制”被经验主义传统视为致命缺陷。
4.5 经济学:金本位的”常识”
重商主义是16至18世纪主导欧洲的经济理论,其核心信念是:国家财富等于其拥有的金银数量,贸易是零和博弈(一方之得必为另一方之失),因此国家应当最大化出口、最小化进口以积累贵金属。这个理论统治了约250年,深刻塑造了欧洲的殖民扩张和贸易战争。
重商主义为什么在当时是”合理的妥协”?因为在工业革命之前,生产力增长极其缓慢,全球财富总量在人的一生中几乎不变。在这个约束条件下,”财富是固定的蛋糕”这个假设看起来完全符合经验。亚当·斯密在1776年《国富论》中指出,财富不是金银,而是一个国家的生产能力,贸易是互利的而非零和的。但这一洞察只有在工业革命展示了生产力可以爆炸式增长之后才变得可信。
值得注意的是,重商主义的”拖鞋”至今仍在被穿。2026年的世界仍充斥着关税壁垒和贸易保护主义——本质上是同一种16世纪的零和思维在21世纪的复活。这说明妥协理论的惯性可以超越其被”正式推翻”的时间点,以变形的方式继续存在。
4.6 物理学:牛顿力学——最成功的拖鞋
牛顿力学是妥协理论中最有趣的案例,因为它太成功了。它在日常尺度上的预测精度如此之高,以至于即使在相对论和量子力学出现一百多年后的今天,我们仍然在日常生活、工程设计、甚至卫星轨道计算中使用牛顿力学。
每个物理理论都只在特定参数范围内有效。牛顿力学可以作为狭义相对论的低速近似被推导出来。同样,平面地球理论是球形地球理论在小距离上的近似。但”有效性”和”真理性”是两回事。牛顿力学在日常尺度上”有效”,但它对引力本质的理解(超距作用力)是根本错误的——爱因斯坦揭示引力实际上是时空弯曲。
牛顿力学之所以特殊,是因为它展示了妥协理论最危险的形态:一个”足够好”的理论可以永远阻止人们去寻找”真正正确”的理论。如果水星近日点进动的微小偏差没有被足够精密的望远镜观测到,广义相对论可能会推迟很久才被接受。
4.7 化学:燃素说的”缝补”
燃素说提供了一个关于路径锁定如何发展为路径崩溃的教科书式案例。1667年,德国医生贝歇尔提出可燃物质含有”燃素”,燃烧时释放。这个理论在没有精密天平的时代完美解释了已知的一切燃烧现象。
当拉瓦锡通过精密称量发现燃烧实际上是与氧气化合(质量增加而非减少)后,支持燃素说的资深化学家没有放弃理论,而是反复修补——有人提出燃素具有”负质量”来解释质量增加。Pierre Macquer多次重写他的理论试图兼容新数据,尽管他自己也怀疑燃素说已经注定失败。理论变得越来越复杂,最终在自身矛盾的重压下崩溃。
这正是路径锁定晚期的典型症状:当现实开始与理论冲突时,专家的第一反应不是放弃理论,而是给理论打补丁。每一个补丁都让理论变得更复杂、更不优美、更难以推翻——直到补丁的重量压垮了整个结构。这与托勒密体系用越来越多的”本轮”来解释行星运动的故事如出一辙。
4.8 生物学:自然发生说——”理所当然”的幻觉
从亚里士多德开始,人们”理所当然”地认为生命可以从非生命物质中自发产生:腐肉生蛆,谷仓生鼠,密封容器中出现细菌。Jan Baptista van Helmont甚至提供了一个”制造老鼠”的配方:将小麦和脏衬衫放在一起。
在没有显微镜和无菌操作技术的时代,这些观察确实符合所有可获得的经验证据。蛆确实”出现”在腐肉上(因为肉眼看不到苍蝇产下的卵),细菌确实”出现”在密封容器中(因为巴斯德之前没有人知道空气中漂浮着孢子)。直到Francesco Redi的对照实验和巴斯德的鹅颈瓶实验,才证明了”生命只能来自生命”这一看似激进的命题。
自然发生说是妥协理论最纯粹的形式:它不是推理错误,而是观察工具的精度不足以区分”自发出现”和”从不可见的来源出现”。
4.9 跨案例模式总结
上述所有案例都遵循同一个五阶段生命周期:
Erdős #1196事件处于这个周期的一个前所未有的位置:阶段四的”新工具”不是物理仪器,而是一种认知系统;阶段五的抵抗可能不会像以往那样持续一代人,因为AI可以不断重复这种突破。
第五章
拖鞋理论的有效性
The Validity of the Slipper Theory
除了”妥协理论”这一严肃的学术表述外,我们还提供一个直觉层面的隐喻框架——“拖鞋理论的有效性”——来捕捉同一现象的荒诞维度。
想象全人类穿了90年拖鞋,在此基础上发展出了一整套基于拖鞋的步态学、运动学、竞技理论。每一代运动员都在”如何穿拖鞋跑得更快”这条路上精进。最顶尖的专家就是那个穿拖鞋跑得最快的人。然后有一天,一个根本不知道拖鞋是什么的年轻人,随手递给AI一双跑鞋——AI也不知道拖鞋的存在——它穿上跑鞋,80分钟跑完了全程。
所有穿拖鞋的专家站在终点线后面,看着成绩单,第一反应不是”跑鞋真快”,而是”等等,原来可以不穿拖鞋?”
这就是Lichtman说这个证明来自”天书”时的真正含义——他惊讶的不是速度,而是这条路径本身的存在。
“妥协理论”解释了为什么(理论是生产力约束下的妥协产物)。”拖鞋理论”让你看见荒诞(一整个文明在错误约束条件内部优化了几十年甚至几千年)。一个让人理解,一个让人发笑。一个是论文的标题,一个是演讲的开场。
更深层地看:人类文明就是一部不断升级拖鞋却忘记了自己可以换鞋的历史。每当新鞋出现(望远镜、显微镜、AI),人们首先的反应不是欣喜,而是困惑——因为他们甚至没有意识到自己一直在穿拖鞋。
第六章
知识进化惯性
Evolutionary Inertia of Knowledge
经典理论的有效性叠加经验主义传承,产生了一个严峻的后果:人类知识图谱中包含海量的知识进化惯性错误路径。
这里的”进化惯性”是一个精确的类比。在生物进化中,一个早期的偶然选择会被锁定在所有后代中——例如,脊椎动物的喉返神经绕过主动脉弓再回到喉部,这在鱼类中是合理的最短路径,但在长颈鹿体内就变成了荒谬的四米弯路。这不是”设计错误”,而是进化路径依赖的结果:修改它的成本太高,所以它被一代一代地继承下去。
人类知识的演化遵循完全相同的逻辑。一个早期的路径选择(如用概率论处理原始集问题),一旦产生了成果,就被锁定在整个学科的后续发展中。后来者在上面继续建造,越建越高,越高越不可能推倒重来。这些路径中的每一条,在被选择的那个时刻都是合理的;但它们的合理性来自于当时的约束条件,而非问题的内在本质。
6.1 不可从内部检测
知识进化惯性最危险的特性在于:你无法从系统内部检测到它。如果你是一个在概率论传统中训练出来的数学家,你不会觉得概率论路径是一种”妥协”——你会觉得它是”自然的””显然的””唯一合理的”。系统内部最优秀的人,恰恰是系统惯性最忠实的载体。
这构成了一个认识论层面的深渊:知识越深,盲区越系统化;专业性越强,对替代路径的想象力越弱。这不是个人能力的问题,而是知识组织方式本身的结构性缺陷。
6.2 人类知识图谱的方程式
人类知识图谱 = 有效知识 + 海量的惯性错误路径
这些惯性错误路径不是因为前人愚蠢,而是因为每一代人都在前一代的约束条件下做出了最优选择,然后这些选择被固化为传统,传统制造了专家,专家维护了传统,形成了一个自我强化的闭环。而人类从系统内部无法区分”有效知识”和”惯性错误路径”,因为两者在当前框架下看起来一模一样。
6.3 “伪无解”问题的外部局限性
这直接导致了一个重要推论:人类面临的很多”无解”问题,其”无解”状态可能不是问题本身的属性,而是研究路径的属性。
知识有限性的发展惯性所带来的,是人类很多问题无解的外部局限性。这些问题不是在人类认知极限之外,而是被路径依赖锁死在一个错误的搜索方向上。如果”无解”是路径的属性而非问题的属性,那么切换路径本身就可能把”无解”变成”可解”。
第七章
禅宗认识论的跨时空呼应
A Resonance Across Millennia: Zen Epistemology
AI时代经验主义悖论并非全新的发现。一千三百年前,禅宗六祖慧能已经触碰到了同一个真相。
慧能不识字,没读过一部经,从未站在任何经典的肩上。五祖弘忍门下的神秀是当时最博学的僧人——他就是那个时代的Lichtman——修行最深、最理解传统、最被看好继承衣钵的人。
神秀写下的偈子是:
“身是菩提树,心如明镜台,时时勤拂拭,勿使惹尘埃。”
这是经验主义的完美表达——沿着已有的修行路径,一步一步渐修,精进不懈。逻辑无懈可击,方向和所有前人一致。
慧能的回应是:
“菩提本无树,明镜亦非台,本来无一物,何处惹尘埃。”
他没有沿着神秀的路径走得更远,而是彻底否定了那条路径存在的前提。不是擦得更干净,而是指出根本没有镜子需要擦。
这与GPT-5.4的做法在结构上惊人地一致——不是沿着概率论的路走得比Lichtman更远,而是指出根本不需要走那条路。弘忍选择慧能传衣钵,不是因为慧能”更努力”,而是因为他认识到:慧能的无知恰恰让他直达了本质,而神秀的博学反而让他在表相中打转。
禅宗把这叫做“初心”——铃木俊隆说”初学者的心中有无限可能,专家的心中只有很少”。Price面对那个问题时的状态,就是纯粹的初心。他没有任何关于”这个问题应该怎么解”的预设,所以问题的全部可能性对他(和AI)都是敞开的。
跨越一千三百年的核心命题是同一个:最深的突破往往不来自知识的积累,而来自摆脱知识所强加的框架。慧能用”不立文字,直指人心”做到了。Price和GPT-5.4用”不循旧径,直面问题”做到了。形式完全不同,结构完全相同。
第八章
AI作为异维度认知系统
AI as a Cross-Dimensional Cognitive System
AI的预训练和强化学习后训练,产生的是一种与人类经验主义传承完全不同的知识表征结构。要理解这种差异的深度,我们需要分别审视人类认知的惯性来源和AI认知的异维度特征。这里我们使用”异维度”而非”无惯性”这一更精确的术语——AI不是”没有偏见”,而是从人类学科体系无法触及的维度切入问题。正如从不同角度照射一个物体——每个角度都有盲区,但不同角度的盲区不重叠。
8.1 人类认知的四重惯性锁
认知科学研究揭示了人类决策中系统性偏差的四个基本神经网络原则:关联性(将不相关的信息组合在一起的倾向)、兼容性(优先处理与现有知识一致的信息,即确认偏误的来源)、保留性(一旦处理过的信息就难以忽略,即使它是误导性的)、以及聚焦性(关注主导信息而忽视边缘信息)。
这些偏差不是人类的”缺陷”——它们是生物神经网络在漫长进化过程中被优化出来的高效启发式策略。在日常环境中,它们让人类能够以极低的认知成本做出足够好的决策。但当面对前沿科学问题时,这些同样的机制就变成了路径依赖的制造器:
数学家优先关注与已知方法兼容的思路,自动过滤那些”看起来不像正确方向”的替代路径。Lichtman的概率论路径之所以90年无人质疑,正是因为每一个新研究者在评估可能的方法时,都下意识地将概率论方法评为”兼容的”(因为前人都用了),而将von Mangoldt方法评为”不兼容的”(因为它”属于”另一个领域)。
人类的注意力资源有限,当聚焦于某一领域的深层问题时,必然忽视边缘领域的工具。一个花了七年研究原始集的数学家,他的注意力99%聚焦在这个问题的内部结构上,自然不会去搜索解析数论中看似无关的von Mangoldt函数。
人类数学家接受的训练是序列化的、路径依赖的——先学微积分,再学实分析,再学概率论,每一步都形成了”这个问题应该用这种方法解”的思维惯性。这种序列化训练在积累专业深度的同时,也在认知层面砌起了一堵堵看不见的墙。
8.2 AI的潜在空间:异维度搜索的物理基础
AI的参数空间是另一种东西。von Mangoldt函数、马尔可夫链、原始集理论——在人类的学科分类中,这些分属不同的”抽屉”;但在AI的权重空间里,它们之间的距离可能远比人类认知中的距离要近。
这不是一种隐喻,而是一个可以被数学精确描述的结构差异。人类的学科体系是一棵树——有根、有干、有枝、有叶,从一片叶子到另一片叶子必须沿着树枝回溯。而AI的向量空间更像是一片高维的海洋——任何两个概念之间都可以直线连接,不需要经过任何中间节点。
AI没有”这个工具属于解析数论,那个问题属于组合数论”这种学科边界的先验偏见。它的搜索空间从一开始就和人类不同——不是沿着任何一条已知路径走,而是在一个高维的、拓扑结构完全不同的表示空间中寻找最短路径。当GPT-5.4面对原始集问题时,它没有”概率论是标准方法”这个预设,所以von Mangoldt函数——在人类知识树上距离原始集问题很远的一片叶子——在AI的向量空间中可能就在”隔壁”。
8.3 AlphaZero:前车之鉴
Erdős #1196事件并非AI展示无惯性认知的第一个案例。2018年的AlphaZero已经提供了震撼性的先例。
AlphaZero从零开始学习国际象棋,不使用任何人类棋谱,仅通过自我对弈。经过数小时训练后,它击败了当时最强的传统引擎Stockfish。但真正令棋界震惊的不是它的胜率,而是它的下棋方式。
国际象棋大师Matthew Sadler分析了AlphaZero的数千盘棋后说:”这完全不同于以往的引擎,过去的引擎只教你避免战术失误。AlphaZero显然对象棋有非常深刻的理解,你可以从中学到各种重要的东西。”他把它比喻为”发现了某位过去伟大棋手的秘密笔记本”。
PNAS上发表的研究发现了一个惊人的事实:尽管AlphaZero从未见过任何人类棋局,它在训练过程中独立发展出了许多人类象棋概念——开局理论、王的安全、兵型结构等。但同时,它也发展出了人类从未考虑过的策略。在一盘著名的对局中,它连续放弃四个兵,甚至试图放弃第五个。Stockfish认为自己大优,但AlphaZero”非常满意”——因为它发现了一种按照人类象棋规范来看”不可思议”的局面评估方式。
DeepMind的David Silver这样描述这个过程:”这就像一百万个微小的发现,一个接一个,建立起这种创造性的思考方式。”卡斯帕罗夫则写道:”深蓝是一个结束,AlphaZero是一个开始。”
2025年发表在PNAS上的后续研究更进一步:研究者开发了一种方法,从AlphaZero的内部表示中挖掘出人类从未知道的象棋概念,然后将这些概念教给国际象棋特级大师——证明了机器引导的知识发现和教学在人类最高水平上是可能的。
8.4 AlphaZero模式与GPT模式:同构与差异
AlphaZero和GPT-5.4代表了AI无惯性认知的两种不同实现方式,但它们在结构上是同构的:
完全不使用人类数据,仅通过自我对弈从规则中发现知识。它的无惯性来自于根本没有接触过人类的路径。优势:纯粹的无偏见搜索。局限:需要明确定义的规则和可验证的胜负标准。
在海量人类数据上训练,但预训练将分散在不同学科的知识压缩到同一个连续的向量空间中,消解了人类教育体系所制造的学科壁垒。它的无惯性不是来自”没见过人类知识”,而是来自”以一种完全不同的拓扑结构组织人类知识”。
GPT模式在某种意义上更接近Erdős #1196事件的本质。GPT-5.4不是”不知道”von Mangoldt函数和原始集理论,恰恰相反——它”知道”两者,但它不像人类那样把它们放在不同的”抽屉”里。在它的内部表示空间中,两者之间的连接可能是自然的、甚至是显而易见的——只是这种”显而易见”存在于一个人类无法直觉感知的高维空间中。
这不是”站在巨人肩膀上”的那种继承关系。更精确的隐喻是:把巨人们分散建造的所有建筑都熔化了,在熔融的材料中重新发现了一种全新的结构。建筑材料是相同的(人类知识),但建筑的组织原则是完全不同的——不再受到历史中”谁先建了什么””哪个学科占了哪块地”这些偶然因素的约束。
8.5 异维度搜索的代价与边界
需要指出的是,AI的异维度认知并非没有代价。研究表明,在标准机器学习中对文本数据进行训练,会产生反映日常人类文化的刻板偏见。AI虽然不受人类学科路径依赖的约束,但它有自身维度上的偏见——训练数据的分布偏见。如果90%的数学文献都沿着概率论路径讨论原始集问题,AI的先验分布中概率论路径的权重也会更高。
Erdős #1196事件中GPT-5.4能够突破这种数据偏见,可能恰恰是因为它被要求从头解决问题(而非总结已有文献)。在生成模式下,AI的搜索过程更接近AlphaZero式的从规则出发的推理,而非简单的模式匹配。Erdős问题论坛上的分析也指出,GPT-5.4的思维链”相当混乱,有很多死胡同”——这看起来更像是一种探索性搜索,而非对已知路径的复述。
这意味着AI的异维度优势不是自动的,而是依赖于使用方式的。当AI被用作”总结已有知识”时,它可能只是在复制人类的路径依赖;当AI被用作”从第一原理出发解决问题”时,它才能从不同维度发挥搜索的全部潜力。Price的贡献恰恰在于:他把问题原封不动地交给AI,没有添加任何关于”应该怎么解”的提示——他的无知保护了AI的异维度搜索能力,使其不被人类路径的提示所”校准”回人类维度。
第九章
新知识生产范式
A New Paradigm of Knowledge Production
Erdős #1196事件揭示了一种可能的新知识生产范式。解锁被路径惯性锁死的”伪无解”问题,需要三个要素的协作:
新手提供的是无偏见的问题输入。AI提供的是无偏见的路径搜索。专家提供的是质量控制和知识整合。三者缺一不可。
Price-GPT-Tao/Lichtman这个组合不是一个偶然的故事,而可能是一种新的知识生产范式的原型。在这个范式中:
在某些前沿问题上,没有路径依赖的提问者比深耕数十年的专家更有可能触发正确的搜索方向。这不是因为无知本身有价值,而是因为专家的知识组织方式会制造系统性的盲区。
AI的角色不是”更快的计算器”,而是一个在人类知识图谱之外拥有独立搜索能力的认知系统。它的价值恰恰在于它不沿着人类的路径思考。
未来最有价值的专家可能不是”在某条路径上走得最远的人”,而是”能够识别和整合来自非传统路径的洞察的人”。Lichtman和陶哲轩在这个事件中的角色——不是发现者,而是验证者和精炼者——可能预示了专家角色的未来形态。
第十章
边界与诚实性:本文论点的限制条件
Boundaries and Honesty: Limitations of This Paper’s Argument
一篇关于认知盲区的论文,如果对自身的盲区缺乏意识,本身就构成一个讽刺。本章诚实地讨论本文论点的适用边界和潜在弱点。
10.1 幸存者偏差:Price事件的孤例性
本文的核心论证建立在Erdős #1196这一单一事件之上。必须诚实地承认:我们只看到了Price的成功,看不到可能存在的成百上千次失败。
陶哲轩本人在评论AI数学成就时指出,未解数学问题遵循”长尾分布”——大量问题实际上相对容易证明,但因缺乏专家关注而悬而未决。AI的”收割”主要集中在这条长尾的末端。2025年10月的调查甚至揭示,最初一些关于AI”解决”Erdős问题的说法实际上只是文献检索——AI找到了数据库维护者未编目的已发表解决方案,而非产生新颖推理。
问题#1196之所以特殊,是因为它不属于上述类别。它是一个被多位专业数学家积极研究过的问题,AI给出了一种确实新颖的方法。但它目前仍然是一个孤例——或者更准确地说,是极少数真正展示了”异维度突破”的案例之一。在这种突破可以被大规模重复之前,经验主义悖论作为”可操作的知识生产策略”的论述应当被视为一种有待验证的假说,而非已被证实的定律。
10.2 AI幻觉与人类幻觉的对称性
关于AI错误率的批评是合理的。AI会产生幻觉——看起来自信但实质错误的输出。Erdős问题论坛上充满了AI提交的错误”证明”,其中一些AI甚至在代码注释中声称”严格证明”实际上只是微小空间的数值检查。
但如果以此否定AI的异维度搜索价值,就必须同时面对一个不舒服的事实:人类经验主义的错误率同样不低,甚至在某些维度上更高。
斯坦福大学教授John Ioannidis在2005年发表的里程碑式论文中论证:”大多数已发表的研究发现可能是错误的。”亚里士多德——西方科学的奠基者——认为大脑是血液的冷却器官,认为苍蝇有四条腿(这个错误在自然历史文本中被重复了一千多年而无人验证),认为雄性动物比雌性牙齿多(只需简单计数就能纠正)。体液说错了两千年,放血杀了华盛顿,lobotomy伤害了五万人并获得了诺贝尔奖。
AI的幻觉持续80分钟,被专家在数天内识别并纠正。人类经验主义的”幻觉”——错误的理论框架——可以持续数百甚至数千年,在此期间造成不可逆的伤害。如果我们要讨论错误率,就必须同时讨论错误的持续时间和纠错成本。在这个对称的比较框架下,AI的错误模式实际上比人类的更加”安全”——因为它的错误更容易被快速检测和纠正。
10.3 “异维度”不等于”永远正确的维度”
将”无惯性”修正为”异维度搜索”之后,一个新的问题浮现:AI的维度也不是全知的维度。它只是一个不同的维度。
这意味着:AI能够看到人类看不到的路径,但它也有自己的盲区——那些在训练数据中稀疏表示的、在向量空间中被边缘化的区域。不是所有人类的”无解”问题都是”伪无解”——有些问题可能确实超出了当前AI和人类的共同认知边界。
更重要的是,经验主义累积在绝大多数时候是有效的,甚至是不可替代的。如果一千个Price每天都在用AI随机攻击开放问题,其中绝大多数得到的将是垃圾输出。异维度搜索不是万能药——它是在经验主义累积路径已经明确耗竭之后,才应当启动的补充策略。将”异维度搜索”泛化为所有科学问题的首选方法,将是另一种形式的路径偏执。
10.4 本文自身的路径依赖
最后,如果经验主义悖论是普遍的,那么这篇论文的论证框架本身是否也受到了某种路径依赖的塑造?答案几乎肯定是”是”。
本文从AlphaZero类比出发,一路推导至经验主义悖论。但如果出发点是另一个——比如从AI在蛋白质折叠(AlphaFold)中的成功出发——论证的方向和重点可能会非常不同。选择Erdős #1196作为核心案例,不可避免地将论证框架拉向了”路径突破”叙事,而部分遮蔽了AI在累积性科学进步中同样重要的贡献(如加速文献搜索、辅助证明验证、扩展计算实验)。
一篇声称”路径依赖无处不在”的论文,不应假装自己免于路径依赖。本文的贡献在于提供了一个有解释力的框架,而非提供了一个无懈可击的真理。读者应当像陶哲轩和Lichtman对待GPT-5.4输出那样对待本文——从中提取有价值的洞察,同时保持对框架本身局限性的清醒意识。
第十一章
结论与展望
Conclusion and Outlook
本文从Erdős #1196这一具体事件出发,提出了以下核心论点:
第一,人类知识传承的结构本身包含一个深层悖论:经验的积累在增强解题能力的同时,也系统性地坍缩了搜索空间,使得最有经验的人恰恰是最难看到替代路径的人。我们将其命名为”AI时代经验主义悖论”。
第二,人类历史上的理论大多是特定生产力约束下的妥协产物——”妥协理论的有效性”——但知识传承机制不会自动标注这些理论的有效域,导致过期的妥协被当作永恒的真理。
第三,经典理论的有效性叠加经验主义传承,在人类知识图谱中积累了海量的”进化惯性错误路径”,这些路径不可从系统内部检测,构成了大量问题”伪无解”的外部局限性。
第四,AI的最深层价值不在于计算力,而在于它能够从人类学科体系无法触及的维度切入问题——充当人类知识图谱的”异维度搜索引擎”和”路径依赖检测器”。这不是”无惯性”,而是”不同维度的搜索”:AI的盲区与人类的盲区不重叠,两者的互补才是真正的价值所在。
第五,经验主义有效性与经验主义悖论是同一知识生产系统的两个阶段,而非对立面。经验主义累积处理90%的科学问题,异维度路径跳跃处理剩下10%中最关键的、被路径依赖锁死在长期无解状态的前沿问题。两者阶段性互补。
如果上述论点成立,那么Erdős #1196只是第一个被公开揭示的案例。在物理学、生物学、医学、经济学、工程学的每一个角落,人类知识图谱中还有多少个”90年没人回头看的路径”在等待被发现?AI是否能系统性地扫描和揭示这些被路径依赖锁死的区域?
这个问题的答案,将决定AI对人类文明的影响是否远远超出我们目前的想象。
人类文明就是一部不断升级拖鞋却忘记了自己可以换鞋的历史。AI的到来,第一次让我们意识到:脚下穿的是拖鞋。
参考与致谢 · References & Acknowledgments
[1] Erdős Problem #1196, erdosproblems.com — Thomas Bloom 维护的Erdős问题数据库及社区讨论
[2] Lichtman, J.D. (2023). “A proof of the Erdős primitive set conjecture.” Forum of Mathematics, Pi, Cambridge University Press
[3] Price, L. 在 erdosproblems.com 论坛发布的 GPT-5.4 Pro 解答(2026年4月)
[4] 陶哲轩(Terence Tao)在 Erdős Problems 论坛 #1196 讨论区的评论(2026年4月)
[5] Scientific American, “Amateur armed with ChatGPT ‘vibe-maths’ a 60-year-old problem”(2026年4月)
[6] Greg Brockman, X/Twitter 上关于 GPT-5.4 Pro 数学贡献的评论(2026年4月)
[7] Varsity, “Queens’ mathmo achieves world’s first autonomous AI proof”(2026年2月)
[8] 铃木俊隆,《禅者的初心》(Zen Mind, Beginner’s Mind),1970年
[9] 维基百科,”List of superseded scientific theories”
[10] 维基百科,”Miasma theory”;”Phlogiston theory”
[11] Stanford Encyclopedia of Philosophy, “Realism and Theory Change in Science”
[12] Krauss, A. (2024). “Debunking revolutionary paradigm shifts: evidence of cumulative scientific progress across science.” Proceedings of the Royal Society A, 480(2302)
[13] McGrath, T. et al. (2022). “Acquisition of Chess Knowledge in AlphaZero.” PNAS, 119(47)
[14] Schrittwieser, J. et al. (2025). “Bridging the human–AI knowledge gap through concept discovery and transfer in AlphaZero.” PNAS
[15] Ioannidis, J.P.A. (2005). “Why Most Published Research Findings Are False.” PLoS Medicine, 2(8)
[16] Berthet, Q. et al. (2018). “A Neural Network Framework for Cognitive Bias.” Frontiers in Psychology, 9:1561
[17] Kuhn, T.S. (1962). The Structure of Scientific Revolutions. University of Chicago Press
[18] Erdős Problems Blog, “Problem 728 and the use of AI on Erdős problems”(2026年1月)
[19] Arbesman, S. (2012). The Half-Life of Facts: Why Everything We Know Has an Expiration Date. Current/Penguin
[20] Silver, D. et al. (2018). “A general reinforcement learning algorithm that masters chess, shogi, and Go through self-play.” Science, 362(6419)
[21] Yahoo News UK, “AI Solved A Mathematical Problem That Had Stumped The World’s Best Minds For Decades”(2026年4月)
[22] webiano.digital, “The proof that forced mathematics to take AI seriously”(2026年4月)
[23] 维基百科,”Continental drift”;”Lobotomy”;”Gold standard”
[24] PMC, “Epidemics before microbiology: stories from the plague in 1711 and cholera in 1853 in Copenhagen”
[25] PMC, “Violence, mental illness, and the brain – A brief history of psychosurgery: Part 1”
[26] USGS, “Historical perspective — This Dynamic Earth”(板块构造论历史)
[27] Smithsonian Magazine, “When Continental Drift Was Considered Pseudoscience”(2013年)
[28] EMBO Reports, “The consequence of errors”(科学错误的历史案例分析)