Virtue AI 是什么：企业 AI 安全平台、使用方法与 Meta 关系

Fri, 26 Jun 2026 10:59:53 +0800

Virtue AI 是一家面向企业的 AI 安全公司，重点不是再做一个聊天机器人，而是给企业已有的模型、应用和 AI Agent 加一层安全、治理和合规能力。

简单说，它想解决的是：企业开始把 AI 接到客服、代码、知识库、财务、内部流程和自动化 Agent 之后，怎么持续发现风险、拦截违规行为，并留下可以审计的证据。

官网把 Virtue AI 定位为 enterprise AI safety platform，核心能力包括自动化红队测试、实时 guardrails、Agent 行为防护、AI 治理和合规报告。它更像企业安全团队、AI 平台团队和合规团队使用的基础设施，而不是普通个人用户每天打开来聊天的工具。

项目地址：

`1`	`https://www.virtueai.com/`

Virtue AI 主要做什么

Virtue AI 的产品线可以分成四类。

第一类是 VirtueRed，用来做持续自动化红队测试。企业可以用它测试 AI 应用、模型和 Agent 是否容易出现越狱、提示词注入、隐私泄露、幻觉、偏见、违规输出等问题。它的意义在于把一次性的安全评测变成持续扫描，适合模型、提示词、RAG 数据和业务逻辑经常变化的系统。

第二类是 VirtueGuard，用来做实时安全拦截。它可以放在聊天应用、Agent Gateway、RAG 管线、上传审核流程或模型调用前后，对文本、代码、图片、视频和音频做安全判断。常见用法是检查用户输入、模型输出、上传内容、生成内容和 AI 生成代码。

第三类是 AgentSuite-Red，用来专门测试 AI Agent。传统 LLM 安全更多关注“模型说了什么”，但 Agent 还会调用工具、读写文件、访问 API、发送消息、执行代码。AgentSuite-Red 提供沙箱环境、攻击任务和自动评测，用来测试 Agent 在直接提示词注入、间接提示词注入和恶意工具场景下是否会失控。

第四类是 AgentSuite-Blue，用来保护正在运行的 Agent。它包含 MCP Guard、Skill Guard、Prompt Guard、Action Guard、访问控制、Shadow AI 检测和可观测性。重点是发现企业里未授权使用的 AI 工具，扫描 MCP 工具和 Agent 技能里的隐藏注入，监控工具调用，在高风险动作真正执行前拦截。

它适合谁

Virtue AI 更适合以下团队：

已经在生产环境使用 LLM、RAG 或 AI Agent 的企业。
有金融、医疗、保险、IT、客服、代码生成等高风险 AI 场景的团队。
需要满足 EU AI Act、GDPR、OWASP LLM Top 10、NIST AI RMF、MITRE、FINRA 等框架的组织。
想把 AI 安全测试接入 CI/CD、上线审批和安全审计流程的团队。
担心员工绕过审批使用外部 AI 工具，也就是 Shadow AI 问题的安全团队。

如果只是个人想找一个 AI 聊天工具，Virtue AI 不是最合适的入口。它的价值主要出现在企业已经有 AI 应用，并且需要统一治理的时候。

怎么用 Virtue AI

Virtue AI 的使用方式不是“注册后直接问问题”，而是围绕企业 AI 系统做接入。

典型流程如下。

先确定要保护什么：聊天机器人、RAG 系统、代码助手、内部 Agent、MCP 工具、文件上传流程，还是已有模型 API。
如果要先发现风险，用 VirtueRed 或 AgentSuite-Red 做红队测试，生成风险报告，定位越狱、注入、隐私泄露、违规输出和 Agent 工具滥用问题。
如果要上线拦截，把 VirtueGuard 或 AgentSuite-Blue 接到请求链路里，对输入、输出、工具调用和 Agent 动作做实时判断。
如果企业有自定义合规规则，可以用 PolicyGuard 这类能力把内部政策、行业要求和监管条款转成可执行 guardrails。
上线后继续看仪表盘、报告和审计记录，把新的风险测试结果重新反馈到策略里。

从文档看，VirtueGuard 支持 REST API，认证方式包括 API key 或 JWT bearer token。它也支持 SaaS、Docker Compose、Helm/Kubernetes 和 Terraform/IaC 等部署方式。也就是说，企业可以先用托管服务验证，再根据数据合规要求部署到私有云或本地环境。

Virtue AI 官网还强调可以接入 OpenAI、Google、LangChain、Claude Code 等常见模型和 Agent 工具链。AgentSuite-Blue 文档里也提到可以通过 hook 或 gateway 接入已有 Web Agent、桌面 Agent 和基于 OpenAI Agents SDK、Anthropic Claude SDK、Google ADK、LangChain 等框架构建的自定义 Agent。

一个更具体的接入例子

假设企业内部有一个客服 RAG 机器人，已经接入了产品文档和用户账户信息。Virtue AI 可以这样用：

用 VirtueRed 扫描机器人，测试它是否会泄露隐私、编造政策、绕过权限或回答不该回答的问题。
用 VirtueGuard 检查用户输入和模型输出，发现违规内容后选择阻断、改写、报警或转人工。
如果客服机器人会调用工具，例如查订单、改地址、退款，就用 AgentSuite-Blue 监控这些动作，避免被提示词注入诱导执行高风险操作。
把扫描报告和拦截记录交给安全、法务和合规团队，用于上线审批和后续审计。

这样做的重点不是让 AI “更聪明”，而是让企业知道 AI 在什么条件下会出错，并在出错前多一道防线。

它和 Meta 是什么关系

截至 2026 年 6 月 26 日，公开信息显示，Meta 和 Virtue AI 的关系主要是人才与团队层面的加入，不应简单写成 Meta 收购了 Virtue AI。

Axios 在 2026 年 6 月 25 日报道称，Meta Superintelligence Labs 正在聘用 Virtue AI 的三位联合创始人 Bo Li、Dawn Song、Sanmi Koyejo，以及 Virtue AI 更广泛团队中的一些成员。报道还提到，这些人会参与 Meta 的 AI 安全、AI Agent 安全和可信系统建设，但交易或安排条款没有公开。

这件事的背景是 Meta 正在加强 Superintelligence Labs，并补强 AI 安全能力。对 Meta 来说，Virtue AI 团队的价值在于他们长期研究对抗机器学习、LLM 风险评估、红队测试和 Agent 安全；对行业来说，这说明大模型竞争不只在模型能力，也在安全、防护、合规和 Agent 控制能力。

所以可以这样理解：

Virtue AI 本身是一家企业 AI 安全平台公司。
Meta 不是 Virtue AI 官网产品的使用入口。
公开报道里没有明确说 Meta 收购了 Virtue AI。
最新关系是 Virtue AI 的多位核心成员加入 Meta Superintelligence Labs，帮助 Meta 做 AI 安全和 AI Agent 安全。

为什么这家公司值得关注

Virtue AI 值得关注，主要因为它踩中了两个趋势。

第一个趋势是企业 AI 从“对话”走向“行动”。Agent 可以调用工具、执行代码、读写数据、改工单、发邮件，风险也从错误回答升级为错误操作。传统内容审核不够用了，企业需要对 Agent 的每一步动作做权限控制和实时拦截。

第二个趋势是 AI 安全开始产品化。过去很多风险评估停留在论文、benchmark 或一次性测试报告里。Virtue AI 的方向是把红队测试、guardrails、合规框架、审计报告和部署能力做成企业平台，让安全团队能持续使用。

当然，它也不是所有人的必需品。中小团队如果只是做一个低风险内部工具，可能先用模型服务商自带 moderation、权限隔离、日志审计和人工复核就够了。只有当 AI 系统开始接入真实业务、敏感数据和自动化动作时，Virtue AI 这类平台的价值才会更明显。

Virtue AI on KnightLi的博客