Anthropic Mythos / Oceanus の噂を読む：レッドチーム、価格予想、開発者が見るべき点

Anthropic Mythos をめぐる議論が再び盛り上がっています。コミュニティでは、Anthropic が Oceanus というコードネームの新しい Mythos チェックポイントをテストしており、すでにレッドチーム段階に入った可能性がある、さらに API 価格が入力 100 万 Token あたり 16 ドル、出力 100 万 Token あたり 80 ドルになる可能性がある、という噂が出ています。

この種の話は「まもなく公開」や「価格確定」として広まりがちです。ただし 2026 年 6 月 8 日時点で確認できる公式情報は、Project Glasswing と Claude Mythos Preview に関する進展です。Anthropic は Oceanus、新しい Mythos の公開時期、上記 API 価格を正式には確認していません。

したがって、より落ち着いた読み方は「追跡する価値のある業界シグナルだが、正式な製品発表ではない」です。

現時点で比較的明確なこと

まず、確認済み情報と未確認情報を分けます。

確認済みなのは、Anthropic が Project Glasswing を進めていることです。2026 年 6 月 2 日の公式記事で、同社は初期の約 50 のパートナーが Claude Mythos Preview を使ってコードベースの脆弱性をスキャンしており、さらに約 150 の新しい組織へアクセス範囲を広げる計画だと説明しました。これらの組織は、アクセスを得る前に安全要件を満たす必要があります。

公式記事では、Anthropic が将来的に Mythos レベルの能力をより広く提供したい一方で、強力なサイバーセキュリティ能力の悪用を防ぐ十分な保護策が前提になるとも述べています。これにより、Mythos 関連能力が通常のチャットモデルのように直接開放されていない理由も説明できます。

未確認なのは次の点です。

Oceanus が Mythos の新しいチェックポイントなのか；
レッドチームテストが 2026 年 6 月 5 日に始まったのか；
アクセス権の転売やプロキシ利用によってテストが一時停止されたのか；
新バージョンが 1〜2 週間以内に公開されるのか；
API 価格が本当に入力 100 万 Token あたり 16 ドル、出力 100 万 Token あたり 80 ドルなのか。

これらは主にコミュニティの情報、テスターのスクリーンショット、二次報道に基づくものです。観察対象としては有用ですが、調達計画や製品ロードマップに直接書き込むべきではありません。

Red Team Testing とは

大規模モデルの正式リリース前には、レッドチームテストがよく行われます。これは通常の機能テストではありません。モデルが制御を失う、権限を越える、情報を漏らす、危険な内容を生成する、プロンプト攻撃で制限を回避される、といった経路を意図的に探す安全評価です。

一般的なテスト項目には次のようなものがあります。

脱獄プロンプトで安全ポリシーを回避できるか；
モデルが危険または違反コンテンツを生成するか；
システムプロンプト、内部ツール、権限境界が漏れるか；
長文コンテキスト、多ターン対話、ツール呼び出しで安定するか；
プロンプトインジェクション、ロールプレイ、間接指示で誤実行するか；
サイバーセキュリティ、コード実行、脆弱性分析などの高リスク能力を制御できるか。

もし Mythos / Oceanus が本当にレッドチーム段階に入ったなら、何らかのリリース候補に近づいている可能性があります。ただし、レッドチーム開始は即時公開を意味しません。安全問題、コンプライアンス、パートナーからのフィードバック、インフラ負荷、商業戦略によって最終スケジュールは変わります。

Oceanus の噂が注目される理由

今回の注目点は、新しいモデルコードネームだけではありません。Mythos の位置づけと関係しています。

Anthropic の Project Glasswing に関する公式説明を見ると、Mythos Preview は通常のチャットアシスタントではなく、サイバーセキュリティとソフトウェア脆弱性分析に向いたフロンティア能力です。重要なソフトウェアコードベースをスキャンし、脆弱性の発見を支援し、パートナーの検証と修復を助けるために使われています。

もし Oceanus が本当に Mythos の後続チェックポイントなら、開発者が気にする点は次のようになります。

コード理解と脆弱性分析が強化されているか；
長い Agent タスクをより確実に実行できるか；
より複雑なツール呼び出しやサンドボックスワークフローを扱えるか；
企業コードベース、依存関係ツリー、パッチ生成に価値があるか；
より広い API アクセスに耐える安全境界があるか。

そのため、既存の高性能 GPT、Gemini、Claude モデルと比較されます。競争軸は日常的な Q&A ではなく、より狭く、高リスクで、高価値なソフトウェアセキュリティとエンジニアリングタスクかもしれません。

価格の噂をどう読むか

噂されている価格は次のとおりです。

種類	噂されている価格
入力 Token	100 万 Token あたり 16 ドル
出力 Token	100 万 Token あたり 80 ドル

これが事実なら、低価格路線ではありません。「高能力、高リスク、高い参入条件」を持つ企業向け能力の価格に近いものです。

ただし、注意点が 3 つあります。

第一に、価格は Anthropic 公式には確認されていません。リリース前のスクリーンショット、代理価格、パートナー価格、内部テスト価格、正式 API 価格はまったく別物である可能性があります。

第二に、出力 Token のほうが高いのは大規模モデル API では一般的です。複雑な推論、コード生成、パッチ生成では、出力長と多ターン呼び出しがコストを急速に押し上げます。

第三に、高価格だから使う価値がないとは限りません。重要なのは、高価値タスクを十分にこなせるかです。重大な脆弱性の自動発見、手動監査時間の削減、重要コードの修復支援は、通常のチャット、要約、単純な補完より高い単価を許容しやすい場合があります。

開発者が本当に見るべきもの

Anthropic が今後 Mythos の新バージョンを正式公開した場合、開発者はベンチマークや噂のスクリーンショットだけを見るべきではありません。より重要なのは実務上の指標です。

1. タスク境界

何に向いているのか。

主にサイバーセキュリティ、防御的コード監査、パッチ生成を対象にするなら、通常のチャット、文章作成、翻訳能力だけで価値を判断するべきではありません。より適切な評価対象は次のとおりです。

大規模コードベースでの脆弱性特定；
依存関係チェーンと呼び出しチェーンの分析；
パッチ提案の品質；
単体テストと回帰テストの生成；
誤検知、見逃し、悪用可能性の判断。

2. 安全性とアクセス制限

サイバーセキュリティ能力が強いほど、アクセス条件は厳しくなりがちです。Project Glasswing の公式説明からも、Anthropic が Mythos レベルの能力を無条件に開放するつもりではないことが読み取れます。

開発者が見るべき点は次のとおりです。

信頼された組織だけが対象なのか；
審査や追加条件への同意が必要なのか；
サイバーセキュリティ系タスクに制限があるのか；
監査ログ、権限分離、データ保護があるのか；
プライベートコードベースを接続できるのか。

これらの制限は、実際の企業開発フローに入れられるかを直接左右します。

3. コスト構造

高性能モデルで最も過小評価されがちなのは、単価ではなく総呼び出しコストです。

Agent 型のコード監査フローには、次のような処理が含まれます。

リポジトリ構造を読む；
モジュールを段階的に分析する；
ツールやサンドボックスを呼び出す；
テストを生成する；
テスト実行後に再修正する；
レポートとパッチをまとめる。

各ステップで大量のコンテキストと出力 Token を消費するなら、最終コストは単純な API 呼び出しを大きく上回ります。人間の時間を明確に減らし、安全リスクを下げ、修復効率を高める場合にのみ、高価格に意味があります。

4. 安定性と再現性

企業プロジェクトは、モデルが「賢そうに見える」だけでは移行しません。本当に重要なのは次の点です。

同じタスクを複数回実行して結果が安定するか；
検証可能な証拠を出せるか；
生成されたパッチがテストを通るか；
推測と事実を明確に分けられるか；
Rate Limit、並行処理、遅延、SLA が本番環境を支えられるか。

セキュリティとコードのタスクでは、派手な出力より検証可能性が重要です。

業界への影響

Mythos / Oceanus の噂が最終的に確認されれば、3 つの方向に影響する可能性があります。

第一に、フロンティアモデル競争は「汎用チャット能力」から「高価値な専門能力」へさらに移るかもしれません。サイバーセキュリティ、コード修復、自動テスト、長い Agent タスクが次の差別化ポイントになり得ます。

第二に、モデル公開ではアクセス制御がより重視されます。攻防の境界に近い能力ほど、普通のモデルのようにすべてのユーザーへ直接開放するのは難しくなります。

第三に、企業調達では「能力 / コスト / リスク」のバランスが重視されます。モデルが強力でも、アクセス制限が多く、コストが高く、コンプライアンス経路が不明確なら、日常開発の標準選択肢にはなりにくいでしょう。

今後の追跡方法

この流れを追うなら、次のシグナルを見るとよいでしょう。

Anthropic 公式ニュース、Claude Platform ドキュメント、pricing ページに Mythos の新項目が出るか；
Project Glasswing の協力範囲がさらに広がるか；
公式の system card、model card、安全評価レポートが出るか；
公開アクセス可能な API model id が出るか；
企業顧客やセキュリティチームが再現可能な事例を公開するか；
噂の価格が正式価格、パートナー価格、代理価格と照合できるか。

公式確認の前に、コミュニティのスクリーンショットや二次報道をリリース事実として扱うべきではありません。開発者にとって実用的なのは、まず観察リストに入れ、正式ドキュメント、価格、アクセス条件が出てから技術評価を行うことです。

まとめ

Anthropic Mythos / Oceanus の噂が注目に値するのは、サイバーセキュリティと複雑なエンジニアリングタスクに向けた、より高リスクかつ高価値なフロンティアモデル能力を示しているからです。Anthropic は Project Glasswing と Claude Mythos Preview の存在を公式に確認しており、この種の能力へのアクセスを慎重に広げていることも確認しています。

しかし Oceanus、レッドチームの時期、テスト停止、公開時期、16 / 80 ドルの価格については、まだ公式確認がありません。現時点で最も堅実な判断は、高シグナルの噂として追跡する価値はあるが、Anthropic の正式発表までは確定したリリースや価格として扱うべきではない、というものです。

参考

Expanding Project Glasswing - Anthropic