Claude Fable 5 提示詞指南:長任務、Agent 和高 effort 的遷移要點

整理 Anthropic 官方 Claude Fable 5 提示工程指南:effort 設定、長任務執行、進度校驗、邊界約束、子 Agent、記憶系統和遷移注意事項。

Anthropic 發佈了面向 Claude Fable 5 和 Claude Mythos 5 的提示工程指南。這篇文件的重點不是介紹模型能力本身,而是告訴開發者:如果把舊的 Claude Opus 4.8 工作流遷移到 Fable 5,提示詞、Agent harness、逾時策略和安全回退都可能需要調整。

Fable 5 的變化可以概括成一句話:它更適合長時間、複雜、端到端的任務,但也更容易在高 effort 下花更多時間規劃、檢查和擴展上下文。用好它,關鍵不是把舊提示詞原封不動搬過去,而是重新設計任務邊界、驗證方式和長任務互動。

先把任務難度拉上去測試

Anthropic 建議,不要只用簡單任務測試 Fable 5。它的優勢更容易出現在過去需要人工花數小時、數天甚至數週完成的工作中,比如大型程式碼遷移、多階段分析、複雜 Agent 流程、跨文件研究和高精度視覺理解。

如果只用短問答、簡單摘要或一次性小函式來評估,容易低估 Fable 5。更合理的測試方式是拿一類舊模型做起來費勁的任務,讓模型完成從理解、計劃、執行到驗證的完整鏈路。

適合測試的任務包括:

  • 讓模型閱讀程式碼庫並完成跨模組修改;
  • 讓模型根據目標規格實作功能、補測試、跑檢查;
  • 讓 Agent 處理多天級別的研究或分析流程;
  • 讓模型從截圖、表格、PDF、圖表中提取結構化資訊;
  • 讓多個子 Agent 分工完成獨立任務,再由主 Agent 彙總。

effort 是主要控制旋鈕

Fable 5 中,effort 是控制智能程度、延遲和成本的主要參數。官方建議,大多數任務可以從 high 開始,最重的能力敏感型任務再用 xhigh,常規任務則可以用 mediumlow

一個值得注意的點是,Fable 5 的低 effort 檔位也可能強於舊模型的高 effort 檔位。也就是說,遷移時不一定要預設把所有任務都拉到最高。更好的策略是:

  • 難題和高價值任務優先用 high
  • 最關鍵的複雜推理或長任務用 xhigh
  • 常規問答、輕量改寫、簡單工具調用用 mediumlow
  • 如果任務能完成但耗時過長,就降低 effort;
  • 如果輸出驗證不足、推理不夠深入,再提高 effort。

高 effort 的好處是推理和自檢更強,代價是模型可能多做上下文收集、額外解釋或不必要的整理。對編碼任務,提示詞裡最好明確限制範圍:

1
不要添加超出任務所需的功能、重構或抽象。修復 bug 不需要順手清理周邊程式碼;一次性操作通常不需要額外 helper。做最簡單且可靠的實作。

長任務要改逾時、串流和進度展示

Fable 5 在困難任務上的單次請求可能執行很多分鐘,自主任務甚至可能持續數小時。這是遷移時最容易踩坑的地方。

如果你的應用原來按短請求設計,需要優先檢查:

  • 客戶端和服務端逾時時間;
  • 是否支援 streaming;
  • 使用者介面是否能展示進度;
  • Agent harness 是否支援非同步檢查;
  • 是否需要用定時任務輪詢,而不是一直阻塞等待。

為了避免模型在模糊任務中過度規劃,可以加一條簡短約束:

1
當你已經有足夠資訊可以行動時,直接行動。不要重新推導對話中已經確認的事實,也不要反覆討論使用者已經決定的選項。

這類提示比寫一大段行為清單更有效,因為 Fable 5 的指令遵循能力已經更強。

讓進度彙報基於真實證據

長時間 Agent 執行中,一個常見問題是模型可能給出聽起來合理、但沒有工具結果支撐的狀態彙報。Anthropic 建議在提示詞中要求模型先審計進度,再向使用者彙報。

可以使用類似約束:

1
在彙報進度前,先把每個聲明和本輪會話中的工具結果對齊。只彙報有證據支持的工作;如果某件事尚未驗證,就明確說明。測試失敗就報告失敗輸出;步驟跳過就說明跳過;完成並驗證後再直接說完成。

這對程式碼 Agent、資料處理 Agent 和長時間研究任務都很重要。使用者真正需要的不是樂觀狀態,而是可追蹤、可複核的進展。

邊界要說清楚

Fable 5 更主動,也更可能在沒有明確要求時做額外動作,比如順手草擬郵件、建立備份分支或擴展任務範圍。遷移舊提示詞時,需要把「什麼時候只給判斷,什麼時候可以動手」說清楚。

例如:

1
當使用者只是在描述問題、提問或思考,而沒有要求修改時,交付物是你的判斷。報告發現後停止,不要主動修復。執行會改變系統狀態的命令前,先確認證據確實支持這個動作。

這條規則對客服、維運、開發工具和企業知識工作都適用。模型越能幹,越需要清楚地定義權限邊界。

子 Agent 要更主動地使用

官方文件提到,Fable 5 比舊模型更擅長調度和維持並行子 Agent。對複雜任務,不需要所有步驟都由主 Agent 順序完成。更好的模式是把獨立子任務分出去,主 Agent 繼續推進主線,並在子 Agent 偏離目標時介入。

適合分派給子 Agent 的任務包括:

  • 在程式碼庫不同模組中查找相關實作;
  • 獨立驗證某個修復是否滿足規格;
  • 分析不同文件或資料源;
  • 對前端實作做視覺對照;
  • 對最終輸出做 fresh-context 審查。

對於長任務,Anthropic 還建議使用獨立驗證子 Agent,而不是只讓模型自我批判。可以在提示詞裡要求:

1
在構建過程中,每隔 [X] 建立一次自檢方法,並用子 Agent 對照規格驗證你的工作。

這能減少「模型自己覺得自己對了」的問題。

記憶系統會提高長期表現

Fable 5 適合有記憶的工作流。官方建議給模型一個可以記錄經驗的位置,哪怕只是 Markdown 文件。關鍵是記錄可複用的教訓,而不是複製聊天記錄。

一個簡單規則是:

1
每個文件只保存一條經驗,頂部寫一句摘要。記錄修正和已驗證的方法,並說明它為什麼重要。不要保存倉庫或聊天歷史已經包含的資訊;能更新舊筆記就不要建立重複筆記;後來發現錯誤的筆記要刪除。

這對持續維護程式碼庫、長期研究專案、企業知識庫和複雜自動化流程尤其有用。Fable 5 不只是一次性執行器,更適合在多次任務之間積累上下文。

不要要求模型複述內部推理

遷移到 Fable 5 時,要檢查舊 prompt、skill 和 system 指令裡是否有「展示思考過程」「複述推理」「解釋內部 reasoning」之類要求。官方文件明確提醒,這類指令可能觸發 reasoning_extraction 拒絕類別,從而導致更多請求回退到 Claude Opus 4.8。

如果應用確實需要推理可見性,應該讀取結構化的 thinking blocks,而不是要求模型把內部推理作為普通回覆文字輸出。長任務中需要把進度展示給使用者,也更適合建立一個 send_to_user 之類的工具,讓 Agent 在不中斷執行的情況下發送必須原樣展示的資訊。

注意安全分類和 fallback

Fable 5 會執行面向高風險領域的安全分類器,重點包括攻擊性網路安全技術、生物與生命科學內容,以及提取模型總結思維的請求。即便是正當的網路安全或生命科學任務,也可能觸發保護機制。

如果請求被拒絕或分流,API 側需要配置 server-side 或 client-side fallback 到 Claude Opus 4.8。也就是說,遷移到 Fable 5 不只是換模型名,還要重新檢查失敗處理、stop_reason: "refusal"、使用者提示和計費路徑。

給使用者的最終回覆要更清楚

在長時間工具調用和 Agent 工作流之後,模型可能積累很多內部上下文,最終總結容易變成只有執行者自己看得懂的 shorthand。Anthropic 建議給模型單獨約束最終回覆風格:先說結果,再說關鍵支持資訊,不要把工作過程中的縮寫、箭頭鏈和內部標籤直接丟給使用者。

可以把最終回覆要求寫成:

1
最終總結面向沒有看到中間過程的讀者。先說明發生了什麼或完成了什麼,再給必要細節。用完整句子,不要使用箭頭鏈、堆疊連字符或臨時發明的標籤。簡短和清楚衝突時,選擇清楚。

這條對產品裡的 Agent 體驗很關鍵。使用者不需要看見模型所有工作痕跡,只需要知道結果、證據、風險和下一步。

遷移時最該先改什麼

如果你已經有 Claude Agent 或提示詞體系,遷移 Fable 5 時可以按這個順序檢查:

  • 把測試任務換成更難、更長、更完整的任務;
  • 重新評估 effort,不要所有任務都預設最高;
  • 調整逾時、streaming 和非同步任務檢查;
  • 給長任務加上基於工具結果的進度審計;
  • 明確模型什麼時候能動手,什麼時候只能報告判斷;
  • 把獨立驗證交給 fresh-context 子 Agent;
  • 增加簡單記憶系統,保存跨任務教訓;
  • 刪除要求模型複述內部推理的舊指令;
  • 配置 Fable 5 拒絕或分流後的 Opus 4.8 fallback;
  • 重寫最終總結風格,讓使用者能快速看懂結果。

Fable 5 的提示工程重點,不是寫更長的規則,而是把工作流設計得更適合強模型:任務更難、邊界更清楚、驗證更真實、互動更非同步。舊模型需要很多細碎約束才能穩定完成的事,在 Fable 5 上往往可以用更短的原則來控制;但長任務、權限邊界和安全回退,反而更需要在 harness 層面提前設計好。

參考來源:Anthropic:Prompting Claude Fable 5

记录并分享
使用 Hugo 建立
主題 StackJimmy 設計