知乎上有一個熱門問題在討論 GPT-5.6:有開發者據稱在 OpenAI Codex 後端日誌裡看到未官宣模型痕跡,其中 iris-alpha 被傳支援約 150 萬 token 上下文窗口。問題的核心不是「這個爆料有多刺激」,而是如果長上下文繼續擴大,會怎樣改變大模型競爭。
先說結論:截至 2026 年 6 月 12 日,我沒有看到 OpenAI 官方發布 GPT-5.6,也沒有看到官方確認 iris-alpha、150 萬 token 上下文或具體發布時間。能確認的是,OpenAI 已經發布 GPT-5.5,官方標註為 100 萬 token 上下文;Anthropic 已經發布 Claude Fable 5,並把它定位為面向長任務、編碼和複雜知識工作的模型。
所以這篇更適合按「傳聞如何解釋競爭方向」來看,而不是把 GPT-5.6 當作已經發布的產品。
150 萬上下文真正意味著什麼
如果 GPT-5.6 真的把上下文窗口從 GPT-5.5 的 100 萬 token 提到 150 萬 token,表面上是長度增加 50%,但影響不只是「能塞更多文字」。
長上下文會直接改變幾類任務:
- 程式碼庫級理解:一次放入更多倉庫結構、依賴、介面和測試資訊。
- 長文件處理:合約、論文、報告、會議記錄和資料包可以減少切片。
- Agent 長任務:模型在多步驟任務裡保留更多歷史決策和中間結果。
- 企業知識檢索:減少對外部 RAG 管線的依賴,但不會完全取代檢索。
不過,上下文越長,成本、延遲和注意力穩定性也越難處理。真正有價值的不是「窗口最大值」,而是模型在超長輸入裡能不能找到關鍵事實、保持指令一致、避免被無關內容干擾,並把結果穩定地落到工具呼叫和可驗證產物上。
也就是說,150 萬上下文如果屬實,它首先會強化 Agent 和企業工作流,而不是單純讓聊天窗口變長。
Anthropic 給了 OpenAI 很大壓力
這次 GPT-5.6 傳聞之所以被放大,是因為 Anthropic 已經正式發布 Claude Fable 5。
Anthropic 官方把 Claude Fable 5 定位為面向最困難知識工作和編碼問題的新一代模型,並強調它適合長時間 Agent 任務、複雜程式碼遷移、企業工作流和視覺文件理解。官方模型頁還寫明,Claude Fable 5 在 API、Claude Platform、AWS、Google Cloud 和 Microsoft Foundry 等渠道可用,價格為每百萬輸入 token 10 美元、每百萬輸出 token 50 美元。
這意味著 Anthropic 的打法很明確:不只是拼聊天能力,而是把模型推向「可以連續幹活」的 Agent 場景。
對 OpenAI 來說,GPT-5.5 官方已經有 100 萬上下文和較強的程式碼、研究、資料分析能力。但如果 Anthropic 在編碼和長任務 benchmark 上形成強勢敘事,OpenAI 就需要用新模型、價格或平台能力回應。
價格戰可能比參數更關鍵
原帖提到 OpenAI 可能考慮降低 token 定價。這個點雖然還沒有官方確認,但方向並不奇怪。
長上下文和 Agent 編程都會放大 token 消耗。一個普通問答可能只用幾千 token;一次程式碼庫分析、自動修復、測試循環和報告生成,可能消耗幾十萬甚至上百萬 token。企業在使用 AI 編程工具時,真正關心的會變成:
- 每個完成任務的總成本是多少?
- 失敗重試要消耗多少 token?
- 長上下文是否真的減少人工時間?
- 模型更貴但更少返工,是否反而更划算?
- 預算花在 OpenAI、Anthropic、Google 還是本地模型上?
所以,大模型競爭會從「每百萬 token 單價」轉向「每個任務的完成成本」。如果一個模型單價高,但一次就能完成複雜任務,它仍然可能更便宜;如果模型單價低,但反覆跑偏、反覆重試,總成本未必低。
算力基礎設施成為模型發布節奏的一部分
關於 OpenAI 租賃俄亥俄州 10GW 資料中心園區的說法,目前也主要來自媒體報導。Data Center Dynamics 和 The Information 等報導稱,OpenAI 正在談判租賃 SB Energy 在俄亥俄州的超大規模資料中心園區,首期約 800MW,預計 2028 年開始營運,完整規模可能達到 10GW。
這類消息未必會立刻影響某個模型發布,但它說明一個趨勢:前沿模型競爭已經不只是演算法、資料和產品,而是電力、晶片、園區、融資和長期租約的競爭。
長上下文、長任務 Agent、更高並發、更低價格,這些需求最後都會落到算力帳本上。模型越能幹,使用者越會把更多工作交給它;使用量越大,基礎設施壓力越明顯。OpenAI 如果想同時維持高性能和低價格,就必須繼續擴張算力供應。
Google 也不會缺席
原帖還提到 Gemini 3.5 Pro 和 200 萬 token 上下文。這裡同樣要區分傳聞和官方確認:具體型號、發布時間和上下文窗口都應以 Google 官方公告為準。
但方向上,Google 確實天然適合打長上下文和基礎設施牌。它有自研 TPU、雲平台、搜尋和 Workspace 生態,也有把模型嵌入辦公、開發和企業資料流的入口。
如果 OpenAI、Anthropic 和 Google 都把下一階段重點放在長上下文與 Agent,那麼競爭會越來越像平台競爭:
- 模型能不能長時間穩定執行任務。
- 能不能接入開發工具、辦公套件和企業系統。
- 權限、稽核、資料隔離是否足夠企業使用。
- 單次任務完成成本是否可控。
- 是否有足夠算力支撐大規模部署。
對開發者意味著什麼
對開發者來說,長上下文模型會讓一些工作方式發生變化。
過去使用 AI 編程助手時,關鍵是把問題切小,把相關檔案逐段餵給模型。未來如果上下文足夠長,開發者可以把更完整的倉庫結構、需求文件、測試輸出和設計約束交給模型,讓它在更大的問題空間裡做計畫。
但這並不等於「上下文越長越無腦」。更大的上下文也需要更好的任務組織:
- 提前說明目標、非目標和驗收標準。
- 把關鍵檔案、日誌和錯誤輸出放在明確位置。
- 要求模型輸出計畫、補丁和測試結果。
- 對高風險修改設定人工確認節點。
- 不把密鑰、隱私資料和生產權限隨意塞進上下文。
未來優秀開發者的能力,很可能不只是會寫程式碼,而是會管理 Agent 的上下文、權限、工具和驗收流程。
小結
GPT-5.6 和 150 萬上下文目前仍是傳聞,不能當作已發布事實。但這條傳聞之所以引發討論,是因為它正好踩中了大模型競爭的核心變化:模型正在從回答問題,走向接管更長、更複雜、更接近真實工作的任務。
下一輪競爭不會只看誰的 benchmark 多贏幾個點,而會看誰能在長上下文、Agent 執行、企業安全、價格和算力供給之間找到平衡。
如果 GPT-5.6 最終發布,真正值得看的也不是上下文數字本身,而是它能否把更大的上下文變成更低的任務成本、更少的人工監督和更穩定的交付結果。
參考連結
- 知乎問題與回答:https://www.zhihu.com/question/2042539496676352614/answer/2048691276334231679
- OpenAI GPT-5.5 官方介紹:https://openai.com/index/introducing-gpt-5-5/
- Anthropic Claude Fable 5 官方介紹:https://www.anthropic.com/news/claude-fable-5-mythos-5
- Anthropic Claude Fable 模型頁:https://www.anthropic.com/claude/fable
- Data Center Dynamics:https://www.datacenterdynamics.com/en/news/openai-in-talks-to-lease-10gw-data-center-from-sb-energy-in-ohio/