Headroom 使用教程：給 Claude Code、Codex 和 AI Agent 省上下文

chopratejas/headroom 是一個給 AI Agent 做上下文壓縮的工具。它解決的問題很現實：Agent 一邊跑命令、一邊讀日誌、一邊搜尋程式碼、一邊塞 RAG 片段，很快就會把上下文視窗填滿，成本和延遲一起上來。

Headroom 的想法是：在內容進入 LLM 之前，先把工具輸出、日誌、檔案、RAG 片段和會話歷史壓縮一次。 README 裡寫的目標很直接：減少 60-95% token，同時盡量保持回答品質。

它解決什麼問題

現在很多 Agent 工具不是模型不夠聰明，而是上下文太髒：

Headroom 做的是「進入模型前的清潔工」。它不取代 LLM，也不取代 RAG，而是在 LLM 前面加上一層壓縮、路由、快取和可回溯檢索。

從 README 看，Headroom 主要有幾種使用型態：

Library：在 Python 或 TypeScript 裡直接呼叫 compress(messages)；
Proxy：透過 headroom proxy --port 8787 做 OpenAI-compatible 代理程式；
Agent wrap：用 headroom wrap claude|codex|cursor|aider|copilot 包一層現有 Agent；
MCP Server：提供 headroom_compress、headroom_retrieve、headroom_stats 給 MCP 用戶端使用；
Cross-agent memory：讓 Claude、Codex、Gemini 等工具分享本地記憶並自動去重；
headroom learn：從失敗會話挖礦經驗，寫入 CLAUDE.md 或 AGENTS.md；
Reversible compression：原文不刪除，需要時可透過檢索工具取回。

這幾個形態很關鍵。它不是只能嵌入程式碼裡的 SDK，也不是只能當代理。你可以從最輕的 wrap 模式開始試，再決定要不要接到自己的應用程式。

Headroom 的架構有幾個關鍵字：

換成人話說，它不是把所有內容都粗暴摘要成一段話，而是先判斷內容類型，再選不同壓縮策略。程式碼、JSON、普通文字、日誌和 RAG 片段，壓縮方式不應該一樣。

README 給出的安裝方式很直接：

1
2


pip install "headroom-ai[all]"
npm install headroom-ai

Python 側需要 Python 3.10+。安裝後可以先試試這幾個指令：

1
2
3


headroom wrap claude
headroom proxy --port 8787
headroom perf

如果你用的是 MCP 客戶端，可以走：

1

headroom mcp install

如果你只是想驗證效果，最簡單的是先跑 headroom perf，看它對典型工作負載能省多少 token。確認可用後，再把它接到 Claude Code、Codex、Cursor 或自己的 OpenAI-compatible 用戶端。

普通摘要最大的問題是不可逆。日誌被總結成“資料庫連線失敗”，你就看不到原始錯誤碼、時間戳記、呼叫棧和上下文了。 Agent 後面如果需要細節，只能重新檢查。

Headroom 的一個重點是 reversible：原始內容保存在本地，壓縮後傳給模型；如果模型需要原文，再透過 headroom_retrieve 取回。這個設計更適合調試、程式碼搜尋和生產日誌分析，因為這些場景經常需要回到細節。

當然，這也意味著你要管理本地儲存和隱私邊界。雖然 README 強調 local-first，但只要你把壓縮後的內容發給雲端模型，還是要依照自己的資料安全要求處理。

我覺得 Headroom 最適合這些場景：

如果你只是偶爾問幾句聊天，或者 prompt 很短，就不一定需要它。 Headroom 的價值主要在「Agent 真正在工作」的時候出現。

上下文壓縮不是魔法。它能省 token，但也可能帶來新問題：

我的建議是用真實任務測試，而不是只看 demo。例如拿一組歷史 bug、CI 日誌、RAG 查詢和程式碼搜尋任務，分別比較「直接餵模型」和「經過 Headroom」後的成本、速度和答案品質。

Headroom 是一個很典型的「上下文工程」工具。它不追求再造一個 Agent，而是站在 Agent 和 LLM 中間，把進入模型的內容壓乾淨、壓短，並保留取回原文的能力。

它適合已經在使用 Claude Code、Codex、Cursor、Aider、Copilot CLI 或 MCP 工具的人。如果你的痛點是“模型上下文經常被日誌和工具輸出撐爆”，Headroom 值得試；如果你的問題只是模型能力不夠，單純壓縮上下文就不一定能解決。

它是本文介紹的一個 AI 工具專案，重點在於它能做什麼、怎麼使用，以及什麼情況下值得嘗試。

主要適合希望把專案接入真實工作流，而不是只閱讀 README 的開發者和 AI 工具使用者。

先確認安裝方式、支援工具、資料與權限邊界，以及專案是否仍在快速變化。

建議先小範圍測試。確認行為穩定後，再考慮用於敏感或生產任務。