Anthropic は 2026 年 6 月 30 日に Claude Sonnet 5 を発表した。Sonnet 系列の新世代モデルであり、単に最高性能を狙うモデルというより、より強い Agent、コーディング、ツール利用能力を日常的に使いやすい価格帯へ持ち込むモデルだ。
Anthropic によると、Sonnet 5 は推論、ツール利用、コーディング、知識作業で Sonnet 4.6 を明確に上回り、一部のタスクでは Opus 4.8 に近づく。それでいて価格は低い。開発者にとって最も直接的な変化は、Claude Code、Claude Platform、Claude API で claude-sonnet-5 を使えることだ。
利用範囲と価格
Claude Sonnet 5 はすべての Claude プランで利用できる。
- Free と Pro ユーザーは Sonnet 5 をデフォルトで利用する。
- Max、Team、Enterprise ユーザーも Sonnet 5 を利用できる。
- Claude Code と Claude Platform は Sonnet 5 に対応済み。
- 開発者は Claude API でモデル名
claude-sonnet-5を指定できる。
API 価格は、導入期に低く、その後標準価格へ移る形になっている。
| 期間 | 入力価格 | 出力価格 |
|---|---|---|
| 2026 年 8 月 31 日まで | 100 万 token あたり 2 ドル | 100 万 token あたり 10 ドル |
| その後の標準価格 | 100 万 token あたり 3 ドル | 100 万 token あたり 15 ドル |
Anthropic は、Sonnet 5 が更新された tokenizer を使うとも説明している。同じ入力でも新 tokenizer では token 数が増える場合があり、内容によっておよそ 1.0〜1.35 倍になる。導入価格の目的のひとつは、Sonnet 4.6 からの移行コスト変化をなだらかにすることだ。
重点的な改善:Sonnet が実行層に近づいた
Sonnet 5 のキーワードは Agent だ。Anthropic は、計画を立て、ブラウザやターミナルなどのツールを使い、より長いタスクチェーンを継続実行できる点を強調している。
開発者や企業ユーザーにとって、意味はかなり明確だ。
- コーディングは断片補完にとどまらず、複数ステップの修正、デバッグ、検証に向く。
- ツール利用が安定し、ブラウザ、ターミナル、業務アプリ、社内ワークフローへ接続しやすい。
- 中程度の effort では費用対効果が高く、高い effort では一部タスクが Opus 4.8 に近づく。
- Claude Code ユーザーにとって、少数の難問だけに使う高価なモデルではなく、日常的な実行モデルになりやすい。
Anthropic は、複雑なコードベース、ブラウンフィールド開発、保険ワークフロー、法律調査、データ分析などでの初期パートナーのフィードバックを紹介している。共通するのは、Sonnet 5 が途中で止まったり助言だけで終わったりせず、タスクをより完整に追えるという点だ。
安全評価:より安全だが、無リスクではない
Anthropic の安全評価には二つの側面がある。
一方で、Sonnet 5 は Sonnet 4.6 より安定している。Agent 安全性、悪意ある要求の拒否、プロンプトインジェクション耐性、幻覚の削減、迎合の低減で改善がある。Anthropic の自動行動監査でも、望ましくない行動の割合は Sonnet 4.6 より低い。
他方で、より強い Opus 4.8 や Mythos Preview より安定しているわけではない。同じ安全評価では、Sonnet 5 の望ましくない行動率はこの二つのモデルより高い。
サイバーセキュリティ能力について、Anthropic は Sonnet 5 をサイバーセキュリティタスクで意図的に訓練していないとしている。通常の無害なセキュリティ作業はいくつかこなせるが、危険性のある能力評価では Opus 4.8 や Mythos 5 より明らかに弱い。Firefox の exploit 評価では、完全に使える exploit の生成には成功しなかったが、Sonnet 4.6 より部分成功率は高かった。
そのため、Sonnet 5 ではサイバーセキュリティ保護がデフォルトで有効になっている。危険なサイバーセキュリティ用途をリアルタイムに検出し、ブロックする仕組みで、強度は Claude Opus 4.7 や Opus 4.8 と近い。ただし Fable 5 のより厳格な保護よりは低い。
移行時に見るべきこと
Claude API や Claude Code をすでに使っているなら、Sonnet 5 は Sonnet 4.6 の直接的なアップグレード候補になる。ただし移行前に三点を確認したい。
第一に、モデル名は次のように変更する。
|
|
第二に、コストは単価だけで見ない。Sonnet 5 の標準価格は導入価格より高く、tokenizer の変更で一部入力の token 消費が増える可能性もある。長コンテキスト、ログ分析、コードベース走査では、実際のリクエストで再計算した方がよい。
第三に、effort 設定は費用対効果を左右する。Sonnet 5 は effort によって広い能力とコストの範囲をカバーできる。日常のコーディング、ドキュメント整理、軽量 Agent タスクでは最高 effort は不要かもしれない。長時間の計画や複数ツール連携が必要なときに effort を上げる方が合理的だ。
Opus 4.8 との関係
Sonnet 5 は Opus 4.8 を置き換えるものではない。より正確には、これまで Opus に近かった一部の Agent 能力が Sonnet レベルに降りてきた、と見るべきだ。
最高の上限が必要なタスク、特に複雑な研究、深い推論、長い Agent チェーン、高難度のコーディングでは、Opus 4.8 にはまだ役割がある。日常的なスループット、価格、安定した実行を重視するなら、Sonnet 5 はデフォルトモデルにしやすい。
今回の発表で最も重要なのはここだ。Sonnet 系列はもはや「速くて安い」中位モデルだけではなく、多くの実行型タスクを担い始めている。企業や開発者にとって、モデル選択は「Opus をデフォルトにして高ければ下げる」から、「Sonnet 5 をデフォルトにして必要なら Opus に上げる」へ変わりそうだ。
まとめ
Claude Sonnet 5 の発表は、Anthropic が Agent 能力を旗艦モデルからより一般的なモデル層へ広げていることを示している。主な売りは単一の benchmark ではなく、より完整なタスク実行能力、受け入れやすい価格、広いデフォルト利用範囲だ。
短期的には、次の三つの用途に注目したい。
- Claude Code での複数ステップのコーディング、デバッグ、コードベース修正。
- 企業内 Agent、データ分析、ドキュメント、ワークフロー自動化。
- コストと能力のバランスを細かく取りたい API アプリケーション。
すでに Sonnet 4.6 を使っているなら、Sonnet 5 は試す価値がある。現在 Opus 4.8 に大きく依存している場合も、中程度の複雑さのタスクを Sonnet 5 に下ろして、コストと完了率の変化を見るとよい。
実践的な移行ガイド:タスクを分けてテストする
チームがすでに Sonnet 4.6 を使っているなら、すべての呼び出しを一気に Sonnet 5 へ切り替えるのはおすすめしない。軽量 Q&A、要約、コード説明、単一ファイル修正、複数ファイルのリファクタリング、長時間 Agent、ツール利用を伴う自動化タスクなど、難度とリスクで分類し、それぞれサンプルを用意する方が堅実だ。
第一ラウンドでは、回答が賢く見えるかではなく、完了率と手戻り率を見る。Claude Code なら、テストの修正漏れが減ったか、リポジトリ構造を安定して理解できるか、不確かなときに質問して止まれるかを比較する。
第二ラウンドではコストを見る。Sonnet 5 の tokenizer 変更で同じ入力でも token 数が増える可能性があるため、公開価格だけで計算せず、実際のログで測る。長コンテキスト、文書分析、コードベースタスクでは token 変化が請求に直結する。
第三ラウンドで初めてデフォルトモデルを決める。私なら、日常の Agent とコーディングタスクにはまず Sonnet 5 を候補にし、失敗時の再試行や高価値タスクに Opus/Fable を残し、軽量バッチ作業に Haiku を使う。この方が移行は滑らかで、本当に改善した部分も見つけやすい。
観察する指標
Sonnet 5 を試すときは、一次完了率、手作業の修正時間、ツール呼び出し失敗率、タスクあたりコストの四つを記録したい。benchmark だけでは誤解しやすい。実際のチームタスクは、コード、文書、環境、権限、コンテキスト記憶が混ざっているからだ。
あるタスク群で Sonnet 5 が旧モデルより安定するなら、そこから優先的に移行すればよい。単に回答が長くなり、変更が大胆になっただけなら、人間の確認を残すか、より保守的なプロンプトにした方がよい。