Virtue AI は、企業向けのAIセキュリティ企業です。もう1つのチャットボットを作るのではなく、企業がすでに使っているモデル、アプリケーション、AI Agent に安全性、ガバナンス、コンプライアンスの層を追加することを目的としています。
簡単に言えば、企業がAIをカスタマーサポート、コード、ナレッジベース、財務、社内ワークフロー、自律型 Agent に接続した後、どうやってリスクを継続的に発見し、ポリシー違反を止め、監査可能な証拠を残すか、という問題を扱うプラットフォームです。
公式サイトでは、Virtue AI は enterprise AI safety platform と位置づけられています。主な機能は、自動レッドチーミング、リアルタイム guardrails、Agent 行動保護、AIガバナンス、コンプライアンスレポートです。個人が毎日開いて会話するツールというより、企業のセキュリティチーム、AIプラットフォームチーム、コンプライアンスチームが使う基盤に近いです。
プロジェクトURL:
|
|
Virtue AI の主な機能
Virtue AI の製品群は大きく4つに分けられます。
1つ目は VirtueRed です。継続的な自動レッドチーミングに使います。企業はこれを使って、AIアプリ、モデル、Agent が jailbreak、プロンプトインジェクション、プライバシー漏えい、幻覚、バイアス、ポリシー違反出力などを起こしやすいかをテストできます。単発の安全性評価を継続スキャンに変える点が重要で、モデル、プロンプト、RAG データ、業務ロジックが頻繁に変わるシステムに向いています。
2つ目は VirtueGuard です。リアルタイムの安全制御に使います。チャットアプリ、Agent Gateway、RAG パイプライン、アップロード審査フロー、モデル呼び出しの前後に置き、テキスト、コード、画像、動画、音声をチェックできます。よくある用途は、ユーザー入力、モデル出力、アップロード内容、生成内容、AI生成コードのチェックです。
3つ目は AgentSuite-Red です。AI Agent のテストに特化しています。従来の LLM セキュリティは「モデルが何を言うか」に注目しがちですが、Agent はツールを呼び出し、ファイルを読み書きし、API にアクセスし、メッセージを送り、コードを実行します。AgentSuite-Red はサンドボックス環境、攻撃タスク、自動評価を提供し、直接・間接プロンプトインジェクションや悪意あるツール環境で Agent が暴走しないかを調べます。
4つ目は AgentSuite-Blue です。本番稼働中の Agent を守るための製品です。MCP Guard、Skill Guard、Prompt Guard、Action Guard、アクセス制御、Shadow AI 検出、可観測性を含みます。企業内で未承認のAIツールを見つけ、MCPツールや Agent スキルに隠れた注入をスキャンし、ツール呼び出しを監視し、高リスク操作が実行される前に止めることが中心です。
誰に向いているか
Virtue AI は次のようなチームに向いています。
- すでに本番環境で LLM、RAG、AI Agent を使っている企業。
- 金融、医療、保険、IT、カスタマーサポート、コード生成など高リスクAI領域を持つチーム。
- EU AI Act、GDPR、OWASP LLM Top 10、NIST AI RMF、MITRE、FINRA などへの対応が必要な組織。
- AIセキュリティテストを CI/CD、リリース承認、安全監査フローに接続したいチーム。
- 社員が承認を迂回して外部AIツールを使う Shadow AI 問題を懸念するセキュリティチーム。
個人がAIチャットツールを探しているだけなら、Virtue AI は最適な入口ではありません。価値が出るのは、企業がすでにAIアプリを持ち、それを統一的に管理する必要がある場合です。
Virtue AI の使い方
Virtue AI は、登録して質問するタイプのツールではありません。企業のAIシステムに組み込んで使います。
典型的な流れは次の通りです。
- まず保護対象を決めます。チャットボット、RAGシステム、コードアシスタント、社内 Agent、MCPツール、ファイルアップロードフロー、既存モデルAPIなどです。
- 先にリスクを見つけたい場合は、VirtueRed または AgentSuite-Red でレッドチーミングを行い、jailbreak、注入、プライバシー漏えい、ポリシー違反、Agent のツール悪用を特定します。
- 本番で止めたい場合は、VirtueGuard または AgentSuite-Blue をリクエスト経路に接続し、入力、出力、ツール呼び出し、Agent の動作をリアルタイムに判定します。
- 企業独自のコンプライアンスルールがある場合は、PolicyGuard のような機能で社内ポリシー、業界要件、規制条項を実行可能な guardrails に変換します。
- 本番後はダッシュボード、レポート、監査ログを見続け、新しいリスクテストの結果をポリシーに反映します。
文書を見る限り、VirtueGuard は REST API をサポートし、API key または JWT bearer token で認証します。SaaS、Docker Compose、Helm/Kubernetes、Terraform/IaC などのデプロイにも対応します。つまり、まずホステッドサービスで検証し、データコンプライアンス要件に応じてプライベートクラウドやオンプレミスに移すことができます。
Virtue AI は OpenAI、Google、LangChain、Claude Code などの一般的なモデルや Agent ツールチェーンとの接続も強調しています。AgentSuite-Blue の文書では、hook または gateway によって既存の Web Agent、デスクトップ Agent、OpenAI Agents SDK、Anthropic Claude SDK、Google ADK、LangChain などで作られたカスタム Agent に接続できると説明されています。
具体的な導入例
企業内に、製品ドキュメントとユーザーアカウント情報につながるカスタマーサポート用 RAG チャットボットがあるとします。Virtue AI は次のように使えます。
- VirtueRed でチャットボットをスキャンし、プライバシー漏えい、架空のポリシー生成、権限回避、本来答えるべきでない質問への回答が起きるかをテストします。
- VirtueGuard でユーザー入力とモデル出力をチェックし、違反内容があればブロック、書き換え、警告、または人間のレビューに回します。
- チャットボットが注文確認、住所変更、返金などのツールを呼び出す場合は、AgentSuite-Blue でそれらの動作を監視し、プロンプトインジェクションによる高リスク操作を防ぎます。
- スキャンレポートとブロック記録をセキュリティ、法務、コンプライアンスチームに共有し、リリース承認と監査に使います。
重要なのは、AIを「より賢くする」ことではありません。AIがどの条件で失敗するかを企業が把握し、失敗が事故になる前に防御線を追加することです。
Meta との関係
2026年6月26日時点の公開情報では、Meta と Virtue AI の関係は主に人材・チームの参加です。Meta が Virtue AI を買収した、と単純に書くべきではありません。
Axios は 2026年6月25日、Meta Superintelligence Labs が Virtue AI の共同創業者である Bo Li、Dawn Song、Sanmi Koyejo の3人と、Virtue AI のより広いチームの一部メンバーを採用していると報じました。彼らは Meta の AI安全、AI Agent セキュリティ、信頼できるシステム構築に関わるとされていますが、条件は公開されていません。
背景には、Meta が Superintelligence Labs を強化し、AI安全能力を補強していることがあります。Meta にとって Virtue AI チームの価値は、敵対的機械学習、LLMリスク評価、レッドチーミング、Agent セキュリティを長く研究してきた点にあります。業界全体にとっては、大規模モデル競争がモデル性能だけでなく、安全、防御、コンプライアンス、Agent 制御にも広がっていることを示しています。
つまり、次のように理解できます。
- Virtue AI 自体は企業向けAI安全プラットフォーム企業です。
- Meta は Virtue AI 製品の利用入口ではありません。
- 公開報道では、Meta が Virtue AI を買収したとは明確に述べられていません。
- 最新の関係は、Virtue AI の複数の中核メンバーが Meta Superintelligence Labs に加わり、AI安全とAI Agent セキュリティに取り組むというものです。
この会社が注目に値する理由
Virtue AI が注目される理由は、2つの流れに乗っているからです。
1つ目は、企業AIが「会話」から「行動」へ移っていることです。Agent はツールを呼び出し、コードを実行し、データを読み書きし、チケットを変更し、メールを送れます。リスクは誤回答から誤操作へ変わります。従来のコンテンツモデレーションだけでは足りず、企業は Agent の各操作に対して権限制御とリアルタイム防御を必要とします。
2つ目は、AI安全の製品化です。これまで多くのリスク評価は、論文、benchmark、単発のレポートにとどまっていました。Virtue AI は、レッドチーミング、guardrails、コンプライアンスフレームワーク、監査レポート、デプロイ機能を企業プラットフォームとしてまとめ、セキュリティチームが継続的に使える形にしようとしています。
もちろん、すべての人に必要なものではありません。小規模チームが低リスクの社内ツールを作るだけなら、モデル提供者の moderation、権限分離、ログ監査、人手レビューで足りる場合があります。AIシステムが実際の業務、機密データ、自動化アクションにつながり始めたとき、Virtue AI のようなプラットフォームの価値がより明確になります。