<?xml version="1.0" encoding="utf-8" standalone="yes"?>
<rss version="2.0" xmlns:atom="http://www.w3.org/2005/Atom">
    <channel>
        <title>模型选型 on KnightLi的博客</title>
        <link>https://knightli.com/tags/%E6%A8%A1%E5%9E%8B%E9%80%89%E5%9E%8B/</link>
        <description>Recent content in 模型选型 on KnightLi的博客</description>
        <generator>Hugo -- gohugo.io</generator>
        <language>zh-cn</language>
        <lastBuildDate>Thu, 02 Jul 2026 07:27:14 +0800</lastBuildDate><atom:link href="https://knightli.com/tags/%E6%A8%A1%E5%9E%8B%E9%80%89%E5%9E%8B/index.xml" rel="self" type="application/rss+xml" /><item>
        <title>Anthropic 当前 Claude 模型怎么选：Fable、Opus、Sonnet、Haiku 对比</title>
        <link>https://knightli.com/2026/07/02/anthropic-claude-models-comparison/</link>
        <pubDate>Thu, 02 Jul 2026 07:27:14 +0800</pubDate>
        
        <guid>https://knightli.com/2026/07/02/anthropic-claude-models-comparison/</guid>
        <description>&lt;p&gt;Anthropic 当前的 Claude 模型线已经不再只是“Haiku 快、Sonnet 均衡、Opus 最强”这么简单。到 2026 年 7 月，官方主推的几类模型包括 Claude Fable 5、Claude Opus 4.8、Claude Sonnet 5、Claude Haiku 4.5，以及受限开放的 Claude Mythos 5。&lt;/p&gt;
&lt;p&gt;如果只想快速选型，可以先记住一句话：日常开发和多数 Agent 任务优先试 Sonnet 5；复杂企业级 Agent 和高难编码用 Opus 4.8；追求最高能力再看 Fable 5；低延迟和成本敏感任务用 Haiku 4.5；Mythos 5 不是通用产品，只面向批准客户。&lt;/p&gt;
&lt;h2 id=&#34;当前主要模型一览&#34;&gt;当前主要模型一览
&lt;/h2&gt;&lt;table&gt;
  &lt;thead&gt;
      &lt;tr&gt;
          &lt;th&gt;模型&lt;/th&gt;
          &lt;th&gt;API ID / alias&lt;/th&gt;
          &lt;th&gt;定位&lt;/th&gt;
          &lt;th&gt;上下文&lt;/th&gt;
          &lt;th&gt;最大输出&lt;/th&gt;
          &lt;th&gt;延迟倾向&lt;/th&gt;
          &lt;th&gt;标准价格&lt;/th&gt;
      &lt;/tr&gt;
  &lt;/thead&gt;
  &lt;tbody&gt;
      &lt;tr&gt;
          &lt;td&gt;Claude Fable 5&lt;/td&gt;
          &lt;td&gt;&lt;code&gt;claude-fable-5&lt;/code&gt;&lt;/td&gt;
          &lt;td&gt;Anthropic 当前广泛发布模型里的最高能力档，适合长流程 Agent&lt;/td&gt;
          &lt;td&gt;1M tokens&lt;/td&gt;
          &lt;td&gt;128k tokens&lt;/td&gt;
          &lt;td&gt;较慢&lt;/td&gt;
          &lt;td&gt;输入 $10 / MTok，输出 $50 / MTok&lt;/td&gt;
      &lt;/tr&gt;
      &lt;tr&gt;
          &lt;td&gt;Claude Opus 4.8&lt;/td&gt;
          &lt;td&gt;&lt;code&gt;claude-opus-4-8&lt;/code&gt;&lt;/td&gt;
          &lt;td&gt;复杂 Agent 编码、企业工作流、浏览器/电脑使用&lt;/td&gt;
          &lt;td&gt;1M tokens&lt;/td&gt;
          &lt;td&gt;128k tokens&lt;/td&gt;
          &lt;td&gt;中等&lt;/td&gt;
          &lt;td&gt;输入 $5 / MTok，输出 $25 / MTok&lt;/td&gt;
      &lt;/tr&gt;
      &lt;tr&gt;
          &lt;td&gt;Claude Sonnet 5&lt;/td&gt;
          &lt;td&gt;&lt;code&gt;claude-sonnet-5&lt;/code&gt;&lt;/td&gt;
          &lt;td&gt;速度、能力和价格最均衡，适合作默认模型&lt;/td&gt;
          &lt;td&gt;1M tokens&lt;/td&gt;
          &lt;td&gt;128k tokens&lt;/td&gt;
          &lt;td&gt;快&lt;/td&gt;
          &lt;td&gt;2026-08-31 前输入 $2 / MTok，输出 $10 / MTok；之后 $3 / $15&lt;/td&gt;
      &lt;/tr&gt;
      &lt;tr&gt;
          &lt;td&gt;Claude Haiku 4.5&lt;/td&gt;
          &lt;td&gt;&lt;code&gt;claude-haiku-4-5&lt;/code&gt;&lt;/td&gt;
          &lt;td&gt;最快、成本最低，适合高吞吐轻任务&lt;/td&gt;
          &lt;td&gt;200k tokens&lt;/td&gt;
          &lt;td&gt;64k tokens&lt;/td&gt;
          &lt;td&gt;最快&lt;/td&gt;
          &lt;td&gt;输入 $1 / MTok，输出 $5 / MTok&lt;/td&gt;
      &lt;/tr&gt;
      &lt;tr&gt;
          &lt;td&gt;Claude Mythos 5&lt;/td&gt;
          &lt;td&gt;&lt;code&gt;claude-mythos-5&lt;/code&gt;&lt;/td&gt;
          &lt;td&gt;与 Fable 5 同规格同价格，但受限开放&lt;/td&gt;
          &lt;td&gt;1M tokens&lt;/td&gt;
          &lt;td&gt;128k tokens&lt;/td&gt;
          &lt;td&gt;较慢&lt;/td&gt;
          &lt;td&gt;输入 $10 / MTok，输出 $50 / MTok&lt;/td&gt;
      &lt;/tr&gt;
  &lt;/tbody&gt;
&lt;/table&gt;
&lt;p&gt;这里的 MTok 指 million tokens，也就是百万 token。价格还会受 prompt caching、batch、数据驻留、云平台区域等因素影响，表格只放最常用的基础输入/输出价格。&lt;/p&gt;
&lt;h2 id=&#34;fable-5最高能力但不是默认首选&#34;&gt;Fable 5：最高能力，但不是默认首选
&lt;/h2&gt;&lt;p&gt;Claude Fable 5 是 Anthropic 当前“广泛发布”模型里能力最高的一档。官方给它的定位是 next-generation intelligence for long-running agents，也就是面向长流程 Agent 的下一代高能力模型。&lt;/p&gt;
&lt;p&gt;它适合这些场景：&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;长时间、多步骤、需要自主推进的 Agent 工作流。&lt;/li&gt;
&lt;li&gt;复杂研究、复杂代码迁移、跨系统规划。&lt;/li&gt;
&lt;li&gt;需要最高推理能力和大上下文的企业任务。&lt;/li&gt;
&lt;li&gt;不太敏感于成本和延迟的高价值任务。&lt;/li&gt;
&lt;/ul&gt;
&lt;p&gt;但 Fable 5 不一定适合作为默认模型。它价格最高，延迟也更慢。除非任务确实需要最高能力，否则从 Sonnet 5 或 Opus 4.8 开始测试通常更稳。&lt;/p&gt;
&lt;p&gt;还要注意一点：Fable 5 使用 adaptive thinking，而且是 always on。这意味着它会自动决定什么时候推理、推理多少；这对复杂任务有帮助，但也会让成本和响应时间更依赖任务本身。&lt;/p&gt;
&lt;h2 id=&#34;opus-48复杂编码和企业-agent-的稳妥选择&#34;&gt;Opus 4.8：复杂编码和企业 Agent 的稳妥选择
&lt;/h2&gt;&lt;p&gt;Claude Opus 4.8 处在 Fable 5 和 Sonnet 5 之间。官方建议，如果不确定复杂 Agent 编码和企业工作该用什么模型，可以从 Opus 4.8 开始。&lt;/p&gt;
&lt;p&gt;它的优势是：&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;1M token 上下文。&lt;/li&gt;
&lt;li&gt;128k token 最大输出。&lt;/li&gt;
&lt;li&gt;复杂编码、浏览器 Agent、电脑使用和企业工作流表现强。&lt;/li&gt;
&lt;li&gt;价格只有 Fable 5 的一半。&lt;/li&gt;
&lt;li&gt;支持 adaptive thinking。&lt;/li&gt;
&lt;/ul&gt;
&lt;p&gt;Opus 4.8 适合放在“高难任务默认模型”的位置。比如代码库级重构、复杂 PR 修复、企业数据分析、多工具 Agent、长文档推理等，都可以先用 Opus 4.8 做基准。&lt;/p&gt;
&lt;p&gt;如果任务非常难，Opus 4.8 不够，再升级 Fable 5；如果任务量很大、成本压力明显，再下放到 Sonnet 5。&lt;/p&gt;
&lt;h2 id=&#34;sonnet-5最适合日常默认的模型&#34;&gt;Sonnet 5：最适合日常默认的模型
&lt;/h2&gt;&lt;p&gt;Claude Sonnet 5 是当前最值得关注的默认候选。它的定位是 best combination of speed and intelligence，也就是速度和智能的平衡点。&lt;/p&gt;
&lt;p&gt;它适合：&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;日常编码和代码审查。&lt;/li&gt;
&lt;li&gt;文档整理、研究助理、知识工作。&lt;/li&gt;
&lt;li&gt;中等复杂度 Agent。&lt;/li&gt;
&lt;li&gt;企业内部自动化流程。&lt;/li&gt;
&lt;li&gt;需要控制成本但又不能牺牲太多质量的 API 应用。&lt;/li&gt;
&lt;/ul&gt;
&lt;p&gt;Sonnet 5 的最大变化，是把许多过去更接近 Opus 级别的 Agent 能力下放到 Sonnet 价格区间。它同样支持 1M token 上下文和 128k token 最大输出，延迟比 Opus 更快。&lt;/p&gt;
&lt;p&gt;价格方面，Sonnet 5 到 2026 年 8 月 31 日前有首发优惠：输入 $2 / MTok，输出 $10 / MTok。2026 年 9 月 1 日起恢复到标准价格：输入 $3 / MTok，输出 $15 / MTok。即便按标准价，它仍然明显低于 Opus 4.8。&lt;/p&gt;
&lt;p&gt;如果要给大多数团队一个起点，我会把 Sonnet 5 放在第一位：先用它覆盖 70% 到 80% 的任务，再把真正困难的任务升级到 Opus 4.8 或 Fable 5。&lt;/p&gt;
&lt;h2 id=&#34;haiku-45高吞吐低延迟低成本&#34;&gt;Haiku 4.5：高吞吐、低延迟、低成本
&lt;/h2&gt;&lt;p&gt;Claude Haiku 4.5 是当前 Claude 主线里最快的模型，官方定位是 fastest model with near-frontier intelligence。&lt;/p&gt;
&lt;p&gt;它适合：&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;分类、抽取、摘要、格式转换。&lt;/li&gt;
&lt;li&gt;批量处理短文本。&lt;/li&gt;
&lt;li&gt;客服、工单、内容审核等高吞吐场景。&lt;/li&gt;
&lt;li&gt;对延迟非常敏感的交互式产品。&lt;/li&gt;
&lt;li&gt;不需要 1M 上下文的轻量任务。&lt;/li&gt;
&lt;/ul&gt;
&lt;p&gt;它的限制也很清楚：上下文是 200k tokens，最大输出是 64k tokens，低于 Fable、Opus 和 Sonnet 的 1M / 128k。对长代码库、复杂多文档分析、长流程 Agent 来说，Haiku 4.5 不应该是首选。&lt;/p&gt;
&lt;p&gt;但如果任务是“量大、简单、需要快”，Haiku 4.5 的性价比非常直接：输入 $1 / MTok，输出 $5 / MTok。&lt;/p&gt;
&lt;h2 id=&#34;mythos-5不要当成普通可选项&#34;&gt;Mythos 5：不要当成普通可选项
&lt;/h2&gt;&lt;p&gt;Claude Mythos 5 和 Fable 5 共享规格与价格，但它不是通用可用模型。Anthropic 文档把它标为 limited availability，仅面向 Project Glasswing 中获批客户。&lt;/p&gt;
&lt;p&gt;换句话说，如果你只是做常规 API 选型，通常不需要把 Mythos 5 放进候选列表。除非你已经是获批客户，或者通过 Anthropic、AWS、Google Cloud 等账号团队获得访问权限，否则它不是一个可以直接替换 Fable 5 的模型。&lt;/p&gt;
&lt;h2 id=&#34;怎么选按任务复杂度分层&#34;&gt;怎么选：按任务复杂度分层
&lt;/h2&gt;&lt;p&gt;可以按下面这个顺序选：&lt;/p&gt;
&lt;ol&gt;
&lt;li&gt;
&lt;p&gt;默认先试 Sonnet 5&lt;br&gt;
适合大多数编码、文档、Agent、企业自动化任务。&lt;/p&gt;
&lt;/li&gt;
&lt;li&gt;
&lt;p&gt;任务明显复杂时升到 Opus 4.8&lt;br&gt;
比如长代码库、多工具、多步骤、需要稳定执行和较强推理的场景。&lt;/p&gt;
&lt;/li&gt;
&lt;li&gt;
&lt;p&gt;追求最高能力时试 Fable 5&lt;br&gt;
适合高价值、长流程、失败成本高、对价格不那么敏感的任务。&lt;/p&gt;
&lt;/li&gt;
&lt;li&gt;
&lt;p&gt;高吞吐轻任务用 Haiku 4.5&lt;br&gt;
适合分类、抽取、摘要、客服、批处理和低延迟交互。&lt;/p&gt;
&lt;/li&gt;
&lt;li&gt;
&lt;p&gt;Mythos 5 只在有权限时考虑&lt;br&gt;
它不是普通开发者默认可选项。&lt;/p&gt;
&lt;/li&gt;
&lt;/ol&gt;
&lt;h2 id=&#34;迁移和成本上的两个细节&#34;&gt;迁移和成本上的两个细节
&lt;/h2&gt;&lt;p&gt;第一，较新的 Claude 模型使用了新 tokenizer。Anthropic 文档说明，Opus 4.7 及之后的 Opus、Fable 5、Mythos 5、Mythos Preview 和 Sonnet 5 的 tokenizer 会让相同文本大约多出 30% token。做成本估算时，不能只看每百万 token 单价。&lt;/p&gt;
&lt;p&gt;第二，1M 上下文不等于每次都应该塞满上下文。Fable 5、Opus 4.8、Sonnet 5 都支持 1M token，上下文很大，但工具调用、缓存、输出和多轮 Agent 都会叠加成本。实际部署时，更好的做法是：&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;常用系统提示和长背景用 prompt caching。&lt;/li&gt;
&lt;li&gt;长文档先分块抽取，再交给高能力模型做综合判断。&lt;/li&gt;
&lt;li&gt;简单步骤交给 Haiku 或 Sonnet，关键决策再升级 Opus / Fable。&lt;/li&gt;
&lt;li&gt;用真实任务跑小样本，而不是只看官方 benchmark。&lt;/li&gt;
&lt;/ul&gt;
&lt;h2 id=&#34;一个简单结论&#34;&gt;一个简单结论
&lt;/h2&gt;&lt;p&gt;Claude 当前的模型线已经很清晰：&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;Fable 5：最高能力，适合最难和最高价值任务。&lt;/li&gt;
&lt;li&gt;Opus 4.8：复杂 Agent 编码和企业任务的强力选择。&lt;/li&gt;
&lt;li&gt;Sonnet 5：最适合日常默认，能力、速度和价格平衡。&lt;/li&gt;
&lt;li&gt;Haiku 4.5：最快最便宜，适合大规模轻任务。&lt;/li&gt;
&lt;li&gt;Mythos 5：受限可用，不当作常规选项。&lt;/li&gt;
&lt;/ul&gt;
&lt;p&gt;如果你正在给产品或内部工作流选 Claude 模型，最实用的策略不是直接追最高档，而是把任务分层：Haiku 处理轻量批量任务，Sonnet 5 做默认执行层，Opus 4.8 处理复杂 Agent 和高难编码，Fable 5 留给最难、最贵、最值得的那一小部分任务。&lt;/p&gt;
&lt;h2 id=&#34;模型路由建议&#34;&gt;模型路由建议
&lt;/h2&gt;&lt;p&gt;给 Claude 模型做选型时，最好不要只做“一个默认模型”。更实用的方式是设计一套路由规则：轻量批处理走 Haiku，日常编码和知识工作走 Sonnet，复杂仓库任务和多步骤 Agent 走 Opus，最高价值、最高难度任务再升级到 Fable。&lt;/p&gt;
&lt;p&gt;路由规则可以先简单一点。例如摘要、分类、字段抽取优先 Haiku；PR review、文档生成、普通代码修改优先 Sonnet；跨模块重构、事故复盘、复杂规划优先 Opus；如果 Opus 连续失败或任务价值很高，再交给 Fable。&lt;/p&gt;
&lt;p&gt;还要给每一档设置退出条件。模型输出不确定、工具调用失败、测试连续不过、上下文超过阈值、任务涉及权限或生产数据时，都应该触发人工确认，而不是继续自动推进。&lt;/p&gt;
&lt;h2 id=&#34;成本评估方法&#34;&gt;成本评估方法
&lt;/h2&gt;&lt;p&gt;模型价格表只能做粗算。真实成本取决于上下文长度、缓存命中率、重试次数、输出长度和人工返工时间。一个更贵的模型如果一次完成率高，可能比便宜模型多次重试更省。&lt;/p&gt;
&lt;p&gt;建议为每类任务记录三项数据：平均 token 成本、平均人工验收时间、失败后升级模型的比例。跑两周之后，通常就能看出哪些任务该放在 Sonnet，哪些任务值得上 Opus 或 Fable。&lt;/p&gt;
&lt;p&gt;参考资料：&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;&lt;a class=&#34;link&#34; href=&#34;https://docs.anthropic.com/en/docs/about-claude/models/overview&#34;  target=&#34;_blank&#34; rel=&#34;noopener&#34;
    &gt;Claude Models overview&lt;/a&gt;&lt;/li&gt;
&lt;li&gt;&lt;a class=&#34;link&#34; href=&#34;https://docs.anthropic.com/en/docs/about-claude/pricing&#34;  target=&#34;_blank&#34; rel=&#34;noopener&#34;
    &gt;Claude Pricing&lt;/a&gt;&lt;/li&gt;
&lt;/ul&gt;
</description>
        </item>
        
    </channel>
</rss>
