OpenAI 帮助中心更新了 Codex 费率表。现在大多数 Plus、Pro、Business、Enterprise、Edu、Health、Gov 和 ChatGPT for Teachers 用户,都应参考新版基于 Token 的额度计费规则。
这次规则变化的重点很明确:Codex 不再主要按“发了几条消息”估算额度,而是把输入 Token、缓存输入 Token、输出 Token 分开计量。任务越长、输出越多、使用的模型越强,额度消耗通常越高。
新版费率适用于哪些套餐
新版基于 Token 的费率表适用于:
- 新老 ChatGPT Plus 和 Pro 用户;
- 新老 ChatGPT Business 用户;
- 新老 Enterprise、Edu、Gov、Health 和 ChatGPT for Teachers 用户。
OpenAI 在页面中说明,2026 年 4 月 2 日起,Codex 定价规则开始从按单条消息计费改为按 API Token 用量计费,并适用于 Plus、Pro、ChatGPT Business 和新的 ChatGPT Enterprise 套餐。2026 年 4 月 23 日,这一更新扩展到现有 ChatGPT Enterprise 套餐,包括 Edu、Health、Gov 和 ChatGPT for Teachers。
少数 Enterprise 客户仍可能暂时沿用旧版费率表。如果你所在组织还没有迁移,实际规则应以工作空间和 OpenAI 销售团队确认的信息为准。
新版 Codex Token 费率表
新版费率按照每 100 万 Token 扣除多少额度来计算,并区分输入、缓存输入和输出。输出通常更贵,缓存输入通常更便宜。
| 模型 | 输入 Token | 缓存输入 Token | 输出 Token |
|---|---|---|---|
| GPT-5.5 | 125 额度 | 12.50 额度 | 750 额度 |
| GPT-5.4 | 62.50 额度 | 6.250 额度 | 375 额度 |
| GPT-5.4-Mini | 18.75 额度 | 1.875 额度 | 113 额度 |
| GPT-5.3-Codex | 43.75 额度 | 4.375 额度 | 350 额度 |
| GPT-5.2 | 43.75 额度 | 4.375 额度 | 350 额度 |
| GPT-5.3-Codex-Spark | 研究预览 | 研究预览 | 研究预览 |
| GPT-Image-2.0(图像) | 200 额度 | 50 额度 | 750 额度 |
| GPT-Image-2.0(文本) | 125 额度 | 31.25 额度 | 250 额度 |
这里的“每 100 万 Token”很关键。一次 Codex 任务最终扣多少额度,不只看你发了几句话,还要看它读取了多少上下文、复用了多少缓存、生成了多长输出,以及是否启用了更高速度的模式。
OpenAI 还特别提到,代码审查功能默认使用 GPT-5.3-Codex。GPT-5.3-Codex-Spark 可能以研究预览形式进入 Codex,费率尚未最终确定。
为什么按 Token 计费更重要
旧版规则用“单条消息”或“单个 Pull Request”做平均估算,适合粗略预算,但不容易解释不同任务之间的差异。新版规则把额度扣除和实际模型活动对应起来,更容易看出哪些地方在消耗额度。
例如,同样是一次 Codex 请求:
- 只让它解释一个小函数,输入和输出都短,消耗会比较低;
- 让它读取多个文件、跑工具、生成长补丁,输入和输出都会变大;
- 在长任务里反复追加需求,会让上下文持续增长;
- 输出大量代码、报告或审查意见时,输出 Token 会成为主要成本。
所以,控制 Codex 成本的重点不是简单少发消息,而是减少无关上下文、拆小任务、控制输出规模,并尽量让每次请求目标清楚。
旧版费率表仍然保留
OpenAI 仍保留旧版费率表,主要是为了兼容少数尚未迁移的 Enterprise 客户。旧版表按消息或 Pull Request 给出平均额度估算。
| 计费单位 | GPT-5.5 | GPT-5.4 | GPT-5.3-Codex | GPT-5.1-Codex-mini |
|---|---|---|---|---|
| 本地任务 1 条消息 | 约 14 额度 | 约 7 额度 | 约 5 额度 | 约 2 额度 |
| 云任务 1 条消息 | 不可用 | 约 34 额度 | 约 25 额度 | 不可用 |
| 代码审查 1 个 Pull Request | 不可用 | 约 34 额度 | 约 25 额度 | 不可用 |
OpenAI 说明,旧版平均额度也适用于旧版 GPT-5.2、GPT-5.2-Codex、GPT-5.1、GPT-5.1-Codex-Max、GPT-5、GPT-5-Codex 和 GPT-5-Codex-Mini。
如果你的账户已经迁移到新版规则,就应优先看 Token 费率表,而不是用旧版消息均值估算。
这会怎样影响实际用量
影响取决于你的工作负载。输出多、上下文长、自动化步骤多、快速模式使用频繁的任务,额度消耗可能明显更高。轻量修改、短问答、小范围代码解释,则可能消耗较少。
OpenAI 给出的参考是:平均每位开发者每月 Codex 使用成本约为 100 到 200 美元,但实际差异会很大。模型选择、并行实例数量、自动化功能和快速模式都会改变最终用量。
去哪里看剩余额度
用户可以在 Codex 设置里的“使用说明”面板中查看使用限制和剩余额度。根据套餐和工作空间角色,有些用户也可以直接购买额度或管理自动充值。
如果你在团队或企业工作空间中无法自行添加额度,通常需要联系工作空间所有者或管理员处理。
实用建议
日常使用 Codex 时,可以按下面几条控制额度消耗:
- 一个任务只设定一个清晰目标;
- 大任务按文件、模块或功能点拆开;
- 不要把无关日志、旧输出和大段上下文反复带入;
- 需要长输出时,先说明范围和格式;
- 频繁审查或长时间自动化任务,要关注输出 Token 和快速模式;
- 团队环境中提前确认是否已经迁移到新版 Token 费率。
新版费率表的核心变化,是让 Codex 的额度消耗更接近真实 Token 成本。以后判断“为什么这次扣得多”,不能只看消息条数,而要看输入、缓存输入和输出三部分共同构成的总用量。
参考来源:Codex 费率表