最近很多人在用 Claude Code 或 Claude Max 时会遇到一个问题:明明买了 Pro、Max 5x,甚至 Max 20x,结果没跑多久就提示额度快满,或者直接需要等重置。尤其是在大项目里让 Claude Code 读很多文件、修复杂 bug、跑长任务时,这种感觉会更明显。
这里先说结论:额度不是按“时间”线性扣的,而是和模型、上下文长度、附件、代码库规模、对话历史、工具调用和当前容量都有关系。同样 5 小时窗口,有的人能用很久,有的人十几分钟就耗尽,通常不是账号坏了,而是每次请求都太重。
这篇整理一套比较实用的省额度习惯。
01 先理解 Claude 的用量窗口
Claude Pro 和 Max 都有使用限制,Claude Code 的使用量会和 Claude 网页、桌面、移动端共享同一套订阅额度。官方说明里提到,消息数量会受到消息长度、附件大小、当前对话长度、所用模型或功能影响;Claude Code 还会受到项目复杂度、代码库大小、自动接受设置等影响。
大致可以这样理解:
- Pro:适合轻量使用和小项目。
- Max 5x:适合更频繁使用和较大的代码库。
- Max 20x:适合更重度、日常高频协作。
- 用量窗口按 5 小时会话重置。
- 长消息、长对话、大文件、复杂任务会更快消耗额度。
- Opus 这类更强模型会比 Sonnet 更快触发限制。
所以“我只用了 20 分钟”这个说法不一定能说明问题。真正重要的是这 20 分钟里 Claude 读了多少上下文、用了什么模型、是否反复处理大文件、是否在同一个长对话里继续加任务。
02 第一件事:不要默认一直用最贵模型
Claude 系列里常见的定位是:
Opus:能力最强,适合复杂推理、架构决策、疑难 bug。Sonnet:能力和成本比较均衡,适合大部分日常编码任务。Haiku:更轻量,适合简单分类、摘要、格式转换等任务。
日常写脚本、改小 bug、整理文档、解释代码,大多数时候 Sonnet 已经够用。Opus 更适合留给这些场景:
- 复杂架构设计。
- 多文件深度重构。
- 难复现的 bug。
- 需要长链路推理的排障。
- 普通模型明显卡住的任务。
Claude Code 里可以用 /model 切换模型,也可以在 /config 里设置默认模型。比较稳的习惯是:默认 Sonnet,关键节点再切 Opus,而不是整场任务都用 Opus 扛。
03 第二件事:控制上下文,不要让旧任务拖着走
上下文越长,Claude 每次处理要看的内容越多,额度消耗也越高。Claude Code 官方文档明确建议主动管理上下文:
- 换到不相关任务时,用
/clear清空历史。 - 当前任务做完一个阶段但还要保留重点时,用
/compact压缩。 - 想知道上下文里什么占空间,用
/context。 - 想持续看到状态,可以配置 status line。
一个好用的节奏是:
|
|
/compact 会把前面的对话压成摘要,保留关键任务状态、结论、文件路径、待办事项,但减少后续每次请求要携带的历史。你也可以给它补一句重点:
|
|
不要等自动压缩才处理。官方文档提到,Claude Code 会在上下文接近容量上限时自动压缩,但手动在阶段边界压缩,通常更可控。
04 第三件事:长对话和大文件会让每次请求变贵
很多人以为“我只是继续问一句”,应该很便宜。但在长对话里,这一句背后可能带着大量历史、文件摘要、工具定义和系统规则。
特别容易涨上下文的东西包括:
- 一直不清理的长对话。
- 让 Claude 读完整大文件。
- 贴很长日志、构建输出、测试输出。
- 一次性塞很多截图或图片。
- 让它反复扫描整个仓库。
- 过长的
CLAUDE.md。 - 开了很多 MCP server。
比较省的做法是:日志只贴关键报错,测试输出只给失败部分,大文件让它先用 rg、head、tail、符号搜索定位,再读必要片段。能用命令行过滤的内容,不要整包塞进上下文。
05 第四件事:理解缓存,但不要迷信缓存
Anthropic 的 Prompt Caching 会缓存重复的 prompt 前缀。默认缓存生命周期是 5 分钟,也支持 1 小时缓存。缓存命中时,重复的大段上下文不需要完整重新处理,有助于降低成本和改善额度利用。
但缓存有几个限制:
- 需要内容完全匹配,文字和图片都要一致。
- 默认缓存是短生命周期。
- 改模型、改工具、改系统提示、改上下文结构,都可能降低命中。
- 输出 token 不会因为缓存而消失,该生成的回答仍然要生成。
- Claude Code 具体如何利用缓存,是产品层实现细节,不要把它当成永远稳定的“免费记忆”。
实际使用里,最重要的不是研究缓存细节,而是保持会话稳定:
- 同一阶段尽量别频繁切模型。
- 不要中途反复改大量规则。
- 不要在同一任务里不停贴新图片。
- 长任务中间不要闲置太久后又继续塞大请求。
- 阶段结束主动
/compact。
这样更容易让重复上下文保持可复用,也能降低后续请求负担。
06 关于高峰时段:能避开就避开,但不要当固定公式
网上常有人说某些时段额度会更紧。官方帮助中心的表述更谨慎:可发送数量会受到 Claude 当前容量、对话长度、附件、模型和功能影响。也就是说,高峰容量确实可能影响体验,但不要把某个地区的某个时间段当成永久固定规则。
实用建议是:
- 大重构、大批量分析尽量放到自己网络和服务都稳定的时段。
- 不要在快到休息时开启一个超长任务。
- 预计会离开很久时,先
/compact或/clear。 - 如果只是小改动,不要开 Opus 加长上下文硬跑。
这比记一个固定“几点到几点不能用”的规则更可靠。
07 精简 CLAUDE.md、rules、MCP 和 skills
Claude Code 会在会话中加载项目规则、工具信息和一部分环境上下文。官方文档也建议把通用规则和专用规则分开,避免每次启动都带着一大包不相关内容。
比较推荐的拆法:
CLAUDE.md:只放全局都适用的核心规则。- rules:放特定路径、特定文件类型才需要的规则。
- skills:放特定工作流,例如发文章、部署、生成图片、提交代码。
- MCP:只启用当前任务真的会用到的 server。
如果 CLAUDE.md 写了几百上千行,每次会话都要带进去。更好的方式是把“偶尔才用”的流程移到 skill 里,需要时再调用。
MCP 也是一样。工具多不等于效率高。Claude Code 文档提到可以用 /mcp 查看并禁用不需要的 server,也可以用 /context 看是什么占用了上下文空间。
08 实用指令清单
日常最常用的是这几个:
|
|
切换模型。默认建议用 Sonnet,复杂推理再用 Opus。
|
|
清空当前上下文。换无关任务时用,最省。
|
|
压缩历史上下文。一个阶段完成但还要继续同一任务时用。
|
|
查看上下文占用,排查是什么吃掉空间。
|
|
查看当前订阅或额度相关状态。官方帮助中心也建议用它监控剩余额度。
|
|
查看和管理 MCP server,关闭当前不用的工具。
如果你用 API 计费模式,还可以关注 /cost;但如果是 Pro/Max 订阅,官方文档说明 /cost 的美元估算不适合作为订阅账单依据,订阅用户更应该看 /stats 和 /status 这类使用信息。
09 一套省额度工作流
比较顺手的流程可以是这样:
- 新任务开始前先
/clear。 - 默认用 Sonnet。
- 先让 Claude 读项目结构和关键文件,不要一口气读全仓库。
- 每做完一个小阶段就
/compact。 - 复杂卡点再切 Opus。
- 日志、报错、测试输出先过滤再给。
- 任务完成后
/clear,不要拖着旧上下文开新活。 - 定期检查
CLAUDE.md、MCP 和 skills,把常驻上下文压小。
这个流程的核心是:让 Claude 每次只看当前真正需要看的东西。
10 小结
Claude Code 额度快速耗尽,通常不是单一原因,而是几个因素叠加:用了高成本模型、长对话一直不清、文件和日志塞太多、MCP 和规则常驻过重、缓存命中变差,再加上高峰容量波动。
省额度的核心也很简单:
- 日常任务优先 Sonnet。
- Opus 留给真正复杂的问题。
- 阶段完成用
/compact。 - 换任务用
/clear。 - 用
/context找上下文占用来源。 - 精简
CLAUDE.md、rules、MCP 和 skills。 - 不要把整仓库、整日志、整图片包都丢进去。
同样的 Pro 或 Max 方案,能做多少事,很大程度取决于你怎么管理上下文。把上下文变小、任务边界变清楚,Claude Code 的可用时间和稳定性都会明显好很多。
参考链接
- Claude Help Center:Using Claude Code with your Pro or Max plan:https://support.claude.com/en/articles/11145838-using-claude-code-with-your-pro-or-max-plan
- Claude Help Center:About Claude’s Max Plan Usage:https://support.anthropic.com/en/articles/11014257-about-claude-s-max-plan-usage/
- Claude Code Docs:Manage costs effectively:https://code.claude.com/docs/en/costs
- Anthropic Docs:Prompt caching:https://docs.anthropic.com/en/docs/build-with-claude/prompt-caching