OpenAI 在 2026 年 5 月 20 日公布了一項很不尋常的研究結果:內部一款通用推理模型在平面單位距離問題上找到新的構造,推翻了數學界長期相信的一個上界猜想。
這不是一個普通聊天機器人隨口給出的答案,而是 OpenAI 內部通用推理模型在一組 Erdős 問題評估中產生的證明。證明已經由外部數學家檢查,OpenAI 也公開了證明文本、配套說明和模型推理思路的刪節版。
問題是什麼
平面單位距離問題由 Paul Erdős 在 1946 年提出。問題本身很好理解:在平面上放置 n 個點,最多能有多少對點之間的距離剛好等於 1?
數學上通常把這個最大數量記為 u(n)。如果把點排成一條直線,可以得到大約 n - 1 對單位距離。若把點排成方形網格,每個點和上下左右相鄰點形成單位距離,數量大約可以達到 2n。Erdős 還給出過更精細的縮放方形網格構造,使單位距離點對數量達到 n^(1+C/log log n) 的量級。
長期以來,數學界普遍認為這類網格構造接近最優。對應的猜想可以粗略寫成:u(n) 不會超過 n^(1+o(1))。這裡的 o(1) 會隨著 n 增大趨近於 0,意思是單位距離點對數可以比線性成長略快,但不應該出現一個固定指數優勢。
OpenAI 模型給出的結果打破了這個直覺。它構造出一族無限多的例子:對於無窮多個 n,可以得到至少 n^(1+δ) 個單位距離點對,其中 δ 是固定正數。OpenAI 官方文章提到,原始 AI 證明沒有給出明確的 δ 數值,但 Will Sawin 後續改進顯示可以取 δ = 0.014。
證明過程為什麼特別
這次突破最有意思的地方,不只是結論本身,而是證明路線。
Erdős 早期構造可以透過高斯整數理解。高斯整數形如 a+bi,它把普通整數擴展到複平面中,並保留了類似唯一分解的性質。借助這種數論結構,可以解釋為什麼某些縮放後的網格會產生很多單位距離。
OpenAI 模型沒有繼續沿著普通幾何直覺推進,而是把問題帶到更複雜的代數數論中。官方解釋稱,新證明使用更一般的代數數域,利用其中更豐富的對稱結構製造大量單位長度差,從而在平面中形成更多距離剛好為 1 的點對。
更技術一點說,證明涉及無限類域塔和 Golod-Shafarevich 理論。這些工具對代數數論研究者並不陌生,但它們突然出現在一個歐氏平面裡的組合幾何問題中,才是外部專家認為這項結果很有啟發性的原因。
這個過程大致可以拆成四步:
- 從單位距離問題的傳統網格構造出發,把「點之間差值長度為 1」轉化為代數結構中的範數和差值問題。
- 用更複雜的代數數域替代高斯整數,讓可用的單位長度差數量變多。
- 借助無限類域塔和 Golod-Shafarevich 理論證明所需數域確實存在。
- 把代數構造重新落回平面點集,得到在無窮多個
n上超過n^(1+o(1))的單位距離點對數量。
也就是說,AI 不是簡單搜尋已有證明,而是把組合幾何和代數數論連接起來,提出了一條人類主流直覺之外的構造路線。
專家反應
OpenAI 官方文章列出了多位數學家的評價,整體態度相當積極,但重點並不完全相同。
組合數學家 Noga Alon 認為,這個問題是 Erdős 最喜歡的問題之一,幾乎所有組合幾何研究者都思考過它。讓他意外的是,正確答案並不符合長期相信的 n^(1+o(1)) 圖景,而新構造還優雅地使用了高級代數數論工具。
菲爾茲獎得主 Tim Gowers 把這件事稱為 AI 數學的里程碑。他的判斷很重:如果這篇論文由人類寫成並投稿到頂級數學期刊,他會毫不猶豫建議接收。這個評價真正強調的是證明品質,而不是 AI 話題本身。
數論學者 Arul Shankar 的關注點在模型能力。他認為這篇論文說明當前 AI 模型已經不只是數學家的助手,還能夠提出原創且巧妙的想法,並把它們推進到完整證明。
Thomas Bloom 在配套說明裡提出了一個更審慎的標準:評價 AI 生成證明,關鍵要看它有沒有讓人類更理解問題。在他看來,這個結果給出的答案是謹慎的肯定。它說明數論構造對離散幾何的影響可能比過去想像得更深。
這些反應共同指向一點:數學界並不是因為「AI 做出來了」就接受結果,而是因為證明可以被檢查,路線能解釋問題,結論也確實改變了原有理解。
這是否意味著 AI 替代數學家
還不能這樣理解。
這次案例裡,AI 提出了關鍵構造和證明路線,但結果成為嚴肅數學成果,仍然依賴外部數學家的檢查、解釋和補充。配套論文的作用也很重要:它把 AI 給出的證明放回數學語境中,解釋為什麼這個構造重要、它與已有研究有什麼關係、未來可能影響哪些問題。
更合理的判斷是:AI 開始進入數學研究上游,但沒有把人類專家擠出研究過程。
過去幾年,AI 在數學裡的角色主要是解競賽題、生成證明草稿、輔助形式化證明、檢索資料或改寫論證。這些任務通常仍由人類指定方向。單位距離問題這次的不同之處在於,模型面對長期開放問題,提出了新構造,並把論證推進到可審查狀態。
這會改變數學研究中的勞動分配。模型可能更擅長批量嘗試長鏈條路線、連接遠距離知識、探索研究者不一定優先嘗試的方向。人類數學家的價值則會集中到幾個更高層的問題上:
- 選擇哪些問題值得研究。
- 判斷 AI 給出的結果是否可信。
- 解釋結果在學科中的位置。
- 決定哪些路線值得繼續投入。
對未來科研的影響
這件事對 AI 產業的意義,可能比對單個數學猜想的意義更大。
數學是檢驗推理能力的理想場景。問題定義清楚,證明能被逐步檢查,一條長論證只要中間斷裂就無法成立。如果模型能在數學中保持複雜論證的連貫性,並連接不同學科工具,那麼類似能力也可能遷移到其他科研領域。
OpenAI 官方文章也把影響延伸到生物、物理、材料科學、工程和醫學。這裡不能簡單理解為「AI 很快會自動做科學發現」。更現實的變化是,AI 可能先成為科研中的路線生成器和假設放大器:它提出大量可能路徑,人類專家篩選、驗證、解釋,再把少數有價值的路徑推進下去。
這會帶來三類變化。
第一,研究速度可能被拉高。很多開放問題不是沒人能理解,而是可嘗試路線太多、跨領域成本太高。AI 如果能持續提出可審查構造,會擴大研究者的搜尋半徑。
第二,跨學科連接會變得更常見。單位距離問題原本屬於組合幾何,新證明卻借助代數數論。未來類似「遠距離知識遷移」可能成為 AI 科研工具的重要價值。
第三,專家審核會更重要。AI 生成的路線越多,越需要可靠的驗證機制。數學可以用證明審查來過濾錯誤,其他實驗科學還需要實驗、資料、復現和安全評估。AI 越像研究者,人類判斷越不能省略。
這和 IMO 解題有什麼不同
過去幾年,AI 數學能力常常透過競賽題來展示,比如 IMO 難度題目、大學數學題或者形式化證明任務。這些測試很重要,但它們和這次單位距離問題突破不是一類事情。
競賽題通常有明確題面、確定答案和相對固定的解題範圍。模型要做的是在有限時間內找到一條可驗證的解法。即使題目很難,它仍然屬於「已被設計出來的問題」,背後通常存在人類出題者預期的解題路徑。
開放數學問題則不同。它沒有標準答案,也不保證現有方法能解決。研究者需要判斷哪些方向值得嘗試,哪些工具可能跨領域遷移,哪些構造雖然反直覺但有機會成立。OpenAI 這次結果的意義正在這裡:模型不是只解一道已知題,而是在一個長期開放問題中提出新構造,並改變了原有猜想。
所以,這次突破更接近數學研究,而不是數學考試。
為什麼數學適合檢驗 AI 推理
數學是檢驗 AI 推理能力的高壓場景,因為它很難靠流暢表達蒙混過關。
一條數學證明必須層層成立。定義是否準確、引理是否可用、推導是否跳步、結論是否真的覆蓋目標命題,都可以被專家逐段檢查。只要中間某一步斷裂,整條證明就站不住。
這讓數學比很多開放式寫作任務更適合作為推理能力的測試場。模型不僅要給出看起來合理的答案,還要讓答案經得起複核。單位距離問題這次尤其有代表性:結論重要,證明路線也能被外部數學家審查和解釋。
當然,數學也不是唯一標準。現實科研還涉及實驗誤差、資料品質、設備條件和工程約束。但數學提供了一個清晰窗口:如果模型能在這裡產出新證明,至少說明它在長鏈條推理和跨領域連接上已經出現了值得認真對待的能力。
AI 證明為什麼仍然需要人類數學家
AI 給出證明,並不等於人類數學家可以退出。
第一,證明需要驗證。AI 生成的論證可能有漏洞、隱藏假設或符號誤用,必須由專家檢查。第二,證明需要解釋。一個結果為什麼重要、它和已有理論有什麼關係、它打開了哪些新問題,這些都不是形式上「證完了」就自動完成的。
第三,證明還需要改進。OpenAI 原始證明沒有給出明確的 δ,後續由 Will Sawin 改進到可以取 δ = 0.014。這說明人類專家仍然在壓縮、澄清和增強結果。
更重要的是,數學研究不是只追求「有一個證明」。研究者還要判斷哪條路線更有價值,哪些問題值得繼續推進,哪些構造可能遷移到其他領域。AI 可以擴大搜尋空間,但學術判斷仍然需要人。
這對 OpenAI 模型路線意味著什麼
從產品視角看,這件事說明 OpenAI 的模型路線正在從「回答問題的聊天助手」,轉向「能參與複雜任務的推理系統」。
聊天助手強調對話、總結、寫作和工具調用。科研推理系統則要能長期保持目標,組合多個領域的知識,生成可驗證的中間步驟,並把探索結果整理成專家能審查的形式。單位距離問題這次展示的,正是後者的一部分。
這也解釋了為什麼 OpenAI 會公開證明、配套說明和模型推理摘要。對科研任務來說,最終答案本身不夠,過程也必須能被檢查。未來面向科研、工程和專業知識工作的模型,很可能會越來越強調可追蹤推理、可複核輸出和專家協作介面。
換句話說,模型不只是更會聊天,而是更像一個可以分擔研究探索的系統。
普通讀者該怎麼看
這件事不宜神化,也不該輕描淡寫。
不宜神化,是因為 AI 還沒有變成獨立科學家。這個結果仍然需要人類數學家檢查、解釋和改進,也需要放回數學共同體中接受長期審視。一次突破不能直接推出「所有科學問題都快被 AI 自動解決」。
不該低估,是因為它確實越過了一個重要門檻。模型不只是複述知識,也不只是解訓練過的相似題,而是在開放問題中給出新構造,並讓專家認為它有數學價值。
更穩妥的理解是:AI 正在成為研究者的強力協作者。它可能先改變的是探索速度、跨領域連接和證明草稿生成,而不是一夜之間替代學術共同體。對普通讀者來說,最值得關注的不是「AI 是否取代數學家」,而是「人類如何利用 AI 擴大能研究的問題範圍」。
結論
OpenAI 這次結果的重要性,不只是推翻了一個近 80 年的猜想,而是展示了通用推理模型參與前沿研究的一種形態:提出構造、連接跨領域工具、產出可由專家審查的證明。
它還不是「AI 獨立科學家」的終點,但已經不是簡單的解題助手。未來幾年,數學可能會繼續成為觀察 AI 科研能力的窗口:哪些問題能被模型推進,哪些證明需要人類補全,哪些跨領域連接會被重新發現,都值得持續關注。
參考資料:
- OpenAI:《An OpenAI model has disproved a central conjecture in discrete geometry》:https://openai.com/index/model-disproves-discrete-geometry-conjecture/
- OpenAI proof PDF:https://cdn.openai.com/pdf/74c24085-19b0-4534-9c90-465b8e29ad73/unit-distance-proof.pdf
- OpenAI companion remarks:https://cdn.openai.com/pdf/74c24085-19b0-4534-9c90-465b8e29ad73/unit-distance-remarks.pdf
- OpenAI model reasoning summary:https://cdn.openai.com/pdf/1625eff6-5ac1-40d8-b1db-5d5cf925de8b/unit-distance-cot.pdf