OpenAI 在 2026 年 5 月 20 日公布了一项很不寻常的研究结果:内部一款通用推理模型在平面单位距离问题上找到新的构造,推翻了数学界长期相信的一个上界猜想。
这不是一个普通聊天机器人随口给出的答案,而是 OpenAI 内部通用推理模型在一组 Erdős 问题评估中产生的证明。证明已经由外部数学家检查,OpenAI 也公开了证明文本、配套说明和模型推理思路的删节版。
问题是什么
平面单位距离问题由 Paul Erdős 在 1946 年提出。问题本身很好理解:在平面上放置 n 个点,最多能有多少对点之间的距离刚好等于 1?
数学上通常把这个最大数量记为 u(n)。如果把点排成一条直线,可以得到大约 n - 1 对单位距离。若把点排成方形网格,每个点和上下左右相邻点形成单位距离,数量大约可以达到 2n。Erdős 还给出过更精细的缩放方形网格构造,使单位距离点对数量达到 n^(1+C/log log n) 的量级。
长期以来,数学界普遍认为这类网格构造接近最优。对应的猜想可以粗略写成:u(n) 不会超过 n^(1+o(1))。这里的 o(1) 会随着 n 增大趋近于 0,意思是单位距离点对数可以比线性增长略快,但不应该出现一个固定指数优势。
OpenAI 模型给出的结果打破了这个直觉。它构造出一族无限多的例子:对于无穷多个 n,可以得到至少 n^(1+δ) 个单位距离点对,其中 δ 是固定正数。OpenAI 官方文章提到,原始 AI 证明没有给出明确的 δ 数值,但 Will Sawin 后续改进显示可以取 δ = 0.014。
证明过程为什么特别
这次突破最有意思的地方,不只是结论本身,而是证明路线。
Erdős 早期构造可以通过高斯整数理解。高斯整数形如 a+bi,它把普通整数扩展到复平面中,并保留了类似唯一分解的性质。借助这种数论结构,可以解释为什么某些缩放后的网格会产生很多单位距离。
OpenAI 模型没有继续沿着普通几何直觉推进,而是把问题带到更复杂的代数数论中。官方解释称,新证明使用更一般的代数数域,利用其中更丰富的对称结构制造大量单位长度差,从而在平面中形成更多距离刚好为 1 的点对。
更技术一点说,证明涉及无限类域塔和 Golod-Shafarevich 理论。这些工具对代数数论研究者并不陌生,但它们突然出现在一个欧氏平面里的组合几何问题中,才是外部专家认为这项结果很有启发性的原因。
这个过程大致可以拆成四步:
- 从单位距离问题的传统网格构造出发,把“点之间差值长度为 1”转化为代数结构中的范数和差值问题。
- 用更复杂的代数数域替代高斯整数,让可用的单位长度差数量变多。
- 借助无限类域塔和 Golod-Shafarevich 理论证明所需数域确实存在。
- 把代数构造重新落回平面点集,得到在无穷多个
n上超过n^(1+o(1))的单位距离点对数量。
也就是说,AI 不是简单搜索已有证明,而是把组合几何和代数数论连接起来,提出了一条人类主流直觉之外的构造路线。
专家反应
OpenAI 官方文章列出了多位数学家的评价,整体态度相当积极,但重点并不完全相同。
组合数学家 Noga Alon 认为,这个问题是 Erdős 最喜欢的问题之一,几乎所有组合几何研究者都思考过它。让他意外的是,正确答案并不符合长期相信的 n^(1+o(1)) 图景,而新构造还优雅地使用了高级代数数论工具。
菲尔兹奖得主 Tim Gowers 把这件事称为 AI 数学的里程碑。他的判断很重:如果这篇论文由人类写成并投稿到顶级数学期刊,他会毫不犹豫建议接收。这个评价真正强调的是证明质量,而不是 AI 话题本身。
数论学者 Arul Shankar 的关注点在模型能力。他认为这篇论文说明当前 AI 模型已经不只是数学家的助手,还能够提出原创且巧妙的想法,并把它们推进到完整证明。
Thomas Bloom 在配套说明里提出了一个更审慎的标准:评价 AI 生成证明,关键要看它有没有让人类更理解问题。在他看来,这个结果给出的答案是谨慎的肯定。它说明数论构造对离散几何的影响可能比过去想象得更深。
这些反应共同指向一点:数学界并不是因为“AI 做出来了”就接受结果,而是因为证明可以被检查,路线能解释问题,结论也确实改变了原有理解。
这是否意味着 AI 替代数学家
还不能这样理解。
这次案例里,AI 提出了关键构造和证明路线,但结果成为严肃数学成果,仍然依赖外部数学家的检查、解释和补充。配套论文的作用也很重要:它把 AI 给出的证明放回数学语境中,解释为什么这个构造重要、它与已有研究有什么关系、未来可能影响哪些问题。
更合理的判断是:AI 开始进入数学研究上游,但没有把人类专家挤出研究过程。
过去几年,AI 在数学里的角色主要是解竞赛题、生成证明草稿、辅助形式化证明、检索资料或改写论证。这些任务通常仍由人类指定方向。单位距离问题这次的不同之处在于,模型面对长期开放问题,提出了新构造,并把论证推进到可审查状态。
这会改变数学研究中的劳动分配。模型可能更擅长批量尝试长链条路线、连接远距离知识、探索研究者不一定优先尝试的方向。人类数学家的价值则会集中到几个更高层的问题上:
- 选择哪些问题值得研究。
- 判断 AI 给出的结果是否可信。
- 解释结果在学科中的位置。
- 决定哪些路线值得继续投入。
对未来科研的影响
这件事对 AI 行业的意义,可能比对单个数学猜想的意义更大。
数学是检验推理能力的理想场景。问题定义清楚,证明能被逐步检查,一条长论证只要中间断裂就无法成立。如果模型能在数学中保持复杂论证的连贯性,并连接不同学科工具,那么类似能力也可能迁移到其他科研领域。
OpenAI 官方文章也把影响延伸到生物、物理、材料科学、工程和医学。这里不能简单理解为“AI 很快会自动做科学发现”。更现实的变化是,AI 可能先成为科研中的路线生成器和假设放大器:它提出大量可能路径,人类专家筛选、验证、解释,再把少数有价值的路径推进下去。
这会带来三类变化。
第一,研究速度可能被拉高。很多开放问题不是没人能理解,而是可尝试路线太多、跨领域成本太高。AI 如果能持续提出可审查构造,会扩大研究者的搜索半径。
第二,跨学科连接会变得更常见。单位距离问题原本属于组合几何,新证明却借助代数数论。未来类似“远距离知识迁移”可能成为 AI 科研工具的重要价值。
第三,专家审核会更重要。AI 生成的路线越多,越需要可靠的验证机制。数学可以用证明审查来过滤错误,其他实验科学还需要实验、数据、复现和安全评估。AI 越像研究者,人类判断越不能省略。
这和 IMO 解题有什么不同
过去几年,AI 数学能力常常通过竞赛题来展示,比如 IMO 难度题目、大学数学题或者形式化证明任务。这些测试很重要,但它们和这次单位距离问题突破不是一类事情。
竞赛题通常有明确题面、确定答案和相对固定的解题范围。模型要做的是在有限时间内找到一条可验证的解法。即使题目很难,它仍然属于“已被设计出来的问题”,背后通常存在人类出题者预期的解题路径。
开放数学问题则不同。它没有标准答案,也不保证现有方法能解决。研究者需要判断哪些方向值得尝试,哪些工具可能跨领域迁移,哪些构造虽然反直觉但有机会成立。OpenAI 这次结果的意义正在这里:模型不是只解一道已知题,而是在一个长期开放问题中提出新构造,并改变了原有猜想。
所以,这次突破更接近数学研究,而不是数学考试。
为什么数学适合检验 AI 推理
数学是检验 AI 推理能力的高压场景,因为它很难靠流畅表达蒙混过关。
一条数学证明必须层层成立。定义是否准确、引理是否可用、推导是否跳步、结论是否真的覆盖目标命题,都可以被专家逐段检查。只要中间某一步断裂,整条证明就站不住。
这让数学比很多开放式写作任务更适合作为推理能力的测试场。模型不仅要给出看起来合理的答案,还要让答案经得起复核。单位距离问题这次尤其有代表性:结论重要,证明路线也能被外部数学家审查和解释。
当然,数学也不是唯一标准。现实科研还涉及实验误差、数据质量、设备条件和工程约束。但数学提供了一个清晰窗口:如果模型能在这里产出新证明,至少说明它在长链条推理和跨领域连接上已经出现了值得认真对待的能力。
AI 证明为什么仍然需要人类数学家
AI 给出证明,并不等于人类数学家可以退出。
第一,证明需要验证。AI 生成的论证可能有漏洞、隐藏假设或符号误用,必须由专家检查。第二,证明需要解释。一个结果为什么重要、它和已有理论有什么关系、它打开了哪些新问题,这些都不是形式上“证完了”就自动完成的。
第三,证明还需要改进。OpenAI 原始证明没有给出明确的 δ,后续由 Will Sawin 改进到可以取 δ = 0.014。这说明人类专家仍然在压缩、澄清和增强结果。
更重要的是,数学研究不是只追求“有一个证明”。研究者还要判断哪条路线更有价值,哪些问题值得继续推进,哪些构造可能迁移到其他领域。AI 可以扩大搜索空间,但学术判断仍然需要人。
这对 OpenAI 模型路线意味着什么
从产品视角看,这件事说明 OpenAI 的模型路线正在从“回答问题的聊天助手”,转向“能参与复杂任务的推理系统”。
聊天助手强调对话、总结、写作和工具调用。科研推理系统则要能长期保持目标,组合多个领域的知识,生成可验证的中间步骤,并把探索结果整理成专家能审查的形式。单位距离问题这次展示的,正是后者的一部分。
这也解释了为什么 OpenAI 会公开证明、配套说明和模型推理摘要。对科研任务来说,最终答案本身不够,过程也必须能被检查。未来面向科研、工程和专业知识工作的模型,很可能会越来越强调可追踪推理、可复核输出和专家协作接口。
换句话说,模型不只是更会聊天,而是更像一个可以分担研究探索的系统。
普通读者该怎么看
这件事不宜神化,也不该轻描淡写。
不宜神化,是因为 AI 还没有变成独立科学家。这个结果仍然需要人类数学家检查、解释和改进,也需要放回数学共同体中接受长期审视。一次突破不能直接推出“所有科学问题都快被 AI 自动解决”。
不该低估,是因为它确实越过了一个重要门槛。模型不只是复述知识,也不只是解训练过的相似题,而是在开放问题中给出新构造,并让专家认为它有数学价值。
更稳妥的理解是:AI 正在成为研究者的强力协作者。它可能先改变的是探索速度、跨领域连接和证明草稿生成,而不是一夜之间替代学术共同体。对普通读者来说,最值得关注的不是“AI 是否取代数学家”,而是“人类如何利用 AI 扩大能研究的问题范围”。
结论
OpenAI 这次结果的重要性,不只是推翻了一个近 80 年的猜想,而是展示了通用推理模型参与前沿研究的一种形态:提出构造、连接跨领域工具、产出可由专家审查的证明。
它还不是“AI 独立科学家”的终点,但已经不是简单的解题助手。未来几年,数学可能会继续成为观察 AI 科研能力的窗口:哪些问题能被模型推进,哪些证明需要人类补全,哪些跨领域连接会被重新发现,都值得持续关注。
参考资料:
- OpenAI:《An OpenAI model has disproved a central conjecture in discrete geometry》:https://openai.com/index/model-disproves-discrete-geometry-conjecture/
- OpenAI proof PDF:https://cdn.openai.com/pdf/74c24085-19b0-4534-9c90-465b8e29ad73/unit-distance-proof.pdf
- OpenAI companion remarks:https://cdn.openai.com/pdf/74c24085-19b0-4534-9c90-465b8e29ad73/unit-distance-remarks.pdf
- OpenAI model reasoning summary:https://cdn.openai.com/pdf/1625eff6-5ac1-40d8-b1db-5d5cf925de8b/unit-distance-cot.pdf