Virtue AI とは：企業向けAI安全プラットフォーム、使い方、Metaとの関係

Virtue AI は、企業向けのAIセキュリティ企業です。もう1つのチャットボットを作るのではなく、企業がすでに使っているモデル、アプリケーション、AI Agent に安全性、ガバナンス、コンプライアンスの層を追加することを目的としています。

簡単に言えば、企業がAIをカスタマーサポート、コード、ナレッジベース、財務、社内ワークフロー、自律型 Agent に接続した後、どうやってリスクを継続的に発見し、ポリシー違反を止め、監査可能な証拠を残すか、という問題を扱うプラットフォームです。

公式サイトでは、Virtue AI は enterprise AI safety platform と位置づけられています。主な機能は、自動レッドチーミング、リアルタイム guardrails、Agent 行動保護、AIガバナンス、コンプライアンスレポートです。個人が毎日開いて会話するツールというより、企業のセキュリティチーム、AIプラットフォームチーム、コンプライアンスチームが使う基盤に近いです。

プロジェクトURL：

1

https://www.virtueai.com/

Virtue AI の主な機能

Virtue AI の製品群は大きく4つに分けられます。

1つ目は VirtueRed です。継続的な自動レッドチーミングに使います。企業はこれを使って、AIアプリ、モデル、Agent が jailbreak、プロンプトインジェクション、プライバシー漏えい、幻覚、バイアス、ポリシー違反出力などを起こしやすいかをテストできます。単発の安全性評価を継続スキャンに変える点が重要で、モデル、プロンプト、RAG データ、業務ロジックが頻繁に変わるシステムに向いています。

2つ目は VirtueGuard です。リアルタイムの安全制御に使います。チャットアプリ、Agent Gateway、RAG パイプライン、アップロード審査フロー、モデル呼び出しの前後に置き、テキスト、コード、画像、動画、音声をチェックできます。よくある用途は、ユーザー入力、モデル出力、アップロード内容、生成内容、AI生成コードのチェックです。

3つ目は AgentSuite-Red です。AI Agent のテストに特化しています。従来の LLM セキュリティは「モデルが何を言うか」に注目しがちですが、Agent はツールを呼び出し、ファイルを読み書きし、API にアクセスし、メッセージを送り、コードを実行します。AgentSuite-Red はサンドボックス環境、攻撃タスク、自動評価を提供し、直接・間接プロンプトインジェクションや悪意あるツール環境で Agent が暴走しないかを調べます。

4つ目は AgentSuite-Blue です。本番稼働中の Agent を守るための製品です。MCP Guard、Skill Guard、Prompt Guard、Action Guard、アクセス制御、Shadow AI 検出、可観測性を含みます。企業内で未承認のAIツールを見つけ、MCPツールや Agent スキルに隠れた注入をスキャンし、ツール呼び出しを監視し、高リスク操作が実行される前に止めることが中心です。

誰に向いているか

Virtue AI は次のようなチームに向いています。

すでに本番環境で LLM、RAG、AI Agent を使っている企業。
金融、医療、保険、IT、カスタマーサポート、コード生成など高リスクAI領域を持つチーム。
EU AI Act、GDPR、OWASP LLM Top 10、NIST AI RMF、MITRE、FINRA などへの対応が必要な組織。
AIセキュリティテストを CI/CD、リリース承認、安全監査フローに接続したいチーム。
社員が承認を迂回して外部AIツールを使う Shadow AI 問題を懸念するセキュリティチーム。

個人がAIチャットツールを探しているだけなら、Virtue AI は最適な入口ではありません。価値が出るのは、企業がすでにAIアプリを持ち、それを統一的に管理する必要がある場合です。

Virtue AI の使い方

Virtue AI は、登録して質問するタイプのツールではありません。企業のAIシステムに組み込んで使います。

典型的な流れは次の通りです。

まず保護対象を決めます。チャットボット、RAGシステム、コードアシスタント、社内 Agent、MCPツール、ファイルアップロードフロー、既存モデルAPIなどです。
先にリスクを見つけたい場合は、VirtueRed または AgentSuite-Red でレッドチーミングを行い、jailbreak、注入、プライバシー漏えい、ポリシー違反、Agent のツール悪用を特定します。
本番で止めたい場合は、VirtueGuard または AgentSuite-Blue をリクエスト経路に接続し、入力、出力、ツール呼び出し、Agent の動作をリアルタイムに判定します。
企業独自のコンプライアンスルールがある場合は、PolicyGuard のような機能で社内ポリシー、業界要件、規制条項を実行可能な guardrails に変換します。
本番後はダッシュボード、レポート、監査ログを見続け、新しいリスクテストの結果をポリシーに反映します。

文書を見る限り、VirtueGuard は REST API をサポートし、API key または JWT bearer token で認証します。SaaS、Docker Compose、Helm/Kubernetes、Terraform/IaC などのデプロイにも対応します。つまり、まずホステッドサービスで検証し、データコンプライアンス要件に応じてプライベートクラウドやオンプレミスに移すことができます。

Virtue AI は OpenAI、Google、LangChain、Claude Code などの一般的なモデルや Agent ツールチェーンとの接続も強調しています。AgentSuite-Blue の文書では、hook または gateway によって既存の Web Agent、デスクトップ Agent、OpenAI Agents SDK、Anthropic Claude SDK、Google ADK、LangChain などで作られたカスタム Agent に接続できると説明されています。

具体的な導入例

企業内に、製品ドキュメントとユーザーアカウント情報につながるカスタマーサポート用 RAG チャットボットがあるとします。Virtue AI は次のように使えます。

VirtueRed でチャットボットをスキャンし、プライバシー漏えい、架空のポリシー生成、権限回避、本来答えるべきでない質問への回答が起きるかをテストします。
VirtueGuard でユーザー入力とモデル出力をチェックし、違反内容があればブロック、書き換え、警告、または人間のレビューに回します。
チャットボットが注文確認、住所変更、返金などのツールを呼び出す場合は、AgentSuite-Blue でそれらの動作を監視し、プロンプトインジェクションによる高リスク操作を防ぎます。
スキャンレポートとブロック記録をセキュリティ、法務、コンプライアンスチームに共有し、リリース承認と監査に使います。

重要なのは、AIを「より賢くする」ことではありません。AIがどの条件で失敗するかを企業が把握し、失敗が事故になる前に防御線を追加することです。

Meta との関係

2026年6月26日時点の公開情報では、Meta と Virtue AI の関係は主に人材・チームの参加です。Meta が Virtue AI を買収した、と単純に書くべきではありません。

Axios は 2026年6月25日、Meta Superintelligence Labs が Virtue AI の共同創業者である Bo Li、Dawn Song、Sanmi Koyejo の3人と、Virtue AI のより広いチームの一部メンバーを採用していると報じました。彼らは Meta の AI安全、AI Agent セキュリティ、信頼できるシステム構築に関わるとされていますが、条件は公開されていません。

背景には、Meta が Superintelligence Labs を強化し、AI安全能力を補強していることがあります。Meta にとって Virtue AI チームの価値は、敵対的機械学習、LLMリスク評価、レッドチーミング、Agent セキュリティを長く研究してきた点にあります。業界全体にとっては、大規模モデル競争がモデル性能だけでなく、安全、防御、コンプライアンス、Agent 制御にも広がっていることを示しています。

つまり、次のように理解できます。

Virtue AI 自体は企業向けAI安全プラットフォーム企業です。
Meta は Virtue AI 製品の利用入口ではありません。
公開報道では、Meta が Virtue AI を買収したとは明確に述べられていません。
最新の関係は、Virtue AI の複数の中核メンバーが Meta Superintelligence Labs に加わり、AI安全とAI Agent セキュリティに取り組むというものです。

この会社が注目に値する理由

Virtue AI が注目される理由は、2つの流れに乗っているからです。

1つ目は、企業AIが「会話」から「行動」へ移っていることです。Agent はツールを呼び出し、コードを実行し、データを読み書きし、チケットを変更し、メールを送れます。リスクは誤回答から誤操作へ変わります。従来のコンテンツモデレーションだけでは足りず、企業は Agent の各操作に対して権限制御とリアルタイム防御を必要とします。

2つ目は、AI安全の製品化です。これまで多くのリスク評価は、論文、benchmark、単発のレポートにとどまっていました。Virtue AI は、レッドチーミング、guardrails、コンプライアンスフレームワーク、監査レポート、デプロイ機能を企業プラットフォームとしてまとめ、セキュリティチームが継続的に使える形にしようとしています。

もちろん、すべての人に必要なものではありません。小規模チームが低リスクの社内ツールを作るだけなら、モデル提供者の moderation、権限分離、ログ監査、人手レビューで足りる場合があります。AIシステムが実際の業務、機密データ、自動化アクションにつながり始めたとき、Virtue AI のようなプラットフォームの価値がより明確になります。