Virtue AI 是一家面向企业的 AI 安全公司,重点不是再做一个聊天机器人,而是给企业已有的模型、应用和 AI Agent 加一层安全、治理和合规能力。
简单说,它想解决的是:企业开始把 AI 接到客服、代码、知识库、财务、内部流程和自动化 Agent 之后,怎么持续发现风险、拦截违规行为,并留下可以审计的证据。
官网把 Virtue AI 定位为 enterprise AI safety platform,核心能力包括自动化红队测试、实时 guardrails、Agent 行为防护、AI 治理和合规报告。它更像企业安全团队、AI 平台团队和合规团队使用的基础设施,而不是普通个人用户每天打开来聊天的工具。
项目地址:
|
|
Virtue AI 主要做什么
Virtue AI 的产品线可以分成四类。
第一类是 VirtueRed,用来做持续自动化红队测试。企业可以用它测试 AI 应用、模型和 Agent 是否容易出现越狱、提示词注入、隐私泄露、幻觉、偏见、违规输出等问题。它的意义在于把一次性的安全评测变成持续扫描,适合模型、提示词、RAG 数据和业务逻辑经常变化的系统。
第二类是 VirtueGuard,用来做实时安全拦截。它可以放在聊天应用、Agent Gateway、RAG 管线、上传审核流程或模型调用前后,对文本、代码、图片、视频和音频做安全判断。常见用法是检查用户输入、模型输出、上传内容、生成内容和 AI 生成代码。
第三类是 AgentSuite-Red,用来专门测试 AI Agent。传统 LLM 安全更多关注“模型说了什么”,但 Agent 还会调用工具、读写文件、访问 API、发送消息、执行代码。AgentSuite-Red 提供沙箱环境、攻击任务和自动评测,用来测试 Agent 在直接提示词注入、间接提示词注入和恶意工具场景下是否会失控。
第四类是 AgentSuite-Blue,用来保护正在运行的 Agent。它包含 MCP Guard、Skill Guard、Prompt Guard、Action Guard、访问控制、Shadow AI 检测和可观测性。重点是发现企业里未授权使用的 AI 工具,扫描 MCP 工具和 Agent 技能里的隐藏注入,监控工具调用,在高风险动作真正执行前拦截。
它适合谁
Virtue AI 更适合以下团队:
- 已经在生产环境使用 LLM、RAG 或 AI Agent 的企业。
- 有金融、医疗、保险、IT、客服、代码生成等高风险 AI 场景的团队。
- 需要满足 EU AI Act、GDPR、OWASP LLM Top 10、NIST AI RMF、MITRE、FINRA 等框架的组织。
- 想把 AI 安全测试接入 CI/CD、上线审批和安全审计流程的团队。
- 担心员工绕过审批使用外部 AI 工具,也就是 Shadow AI 问题的安全团队。
如果只是个人想找一个 AI 聊天工具,Virtue AI 不是最合适的入口。它的价值主要出现在企业已经有 AI 应用,并且需要统一治理的时候。
怎么用 Virtue AI
Virtue AI 的使用方式不是“注册后直接问问题”,而是围绕企业 AI 系统做接入。
典型流程如下。
- 先确定要保护什么:聊天机器人、RAG 系统、代码助手、内部 Agent、MCP 工具、文件上传流程,还是已有模型 API。
- 如果要先发现风险,用 VirtueRed 或 AgentSuite-Red 做红队测试,生成风险报告,定位越狱、注入、隐私泄露、违规输出和 Agent 工具滥用问题。
- 如果要上线拦截,把 VirtueGuard 或 AgentSuite-Blue 接到请求链路里,对输入、输出、工具调用和 Agent 动作做实时判断。
- 如果企业有自定义合规规则,可以用 PolicyGuard 这类能力把内部政策、行业要求和监管条款转成可执行 guardrails。
- 上线后继续看仪表盘、报告和审计记录,把新的风险测试结果重新反馈到策略里。
从文档看,VirtueGuard 支持 REST API,认证方式包括 API key 或 JWT bearer token。它也支持 SaaS、Docker Compose、Helm/Kubernetes 和 Terraform/IaC 等部署方式。也就是说,企业可以先用托管服务验证,再根据数据合规要求部署到私有云或本地环境。
Virtue AI 官网还强调可以接入 OpenAI、Google、LangChain、Claude Code 等常见模型和 Agent 工具链。AgentSuite-Blue 文档里也提到可以通过 hook 或 gateway 接入已有 Web Agent、桌面 Agent 和基于 OpenAI Agents SDK、Anthropic Claude SDK、Google ADK、LangChain 等框架构建的自定义 Agent。
一个更具体的接入例子
假设企业内部有一个客服 RAG 机器人,已经接入了产品文档和用户账户信息。Virtue AI 可以这样用:
- 用 VirtueRed 扫描机器人,测试它是否会泄露隐私、编造政策、绕过权限或回答不该回答的问题。
- 用 VirtueGuard 检查用户输入和模型输出,发现违规内容后选择阻断、改写、报警或转人工。
- 如果客服机器人会调用工具,例如查订单、改地址、退款,就用 AgentSuite-Blue 监控这些动作,避免被提示词注入诱导执行高风险操作。
- 把扫描报告和拦截记录交给安全、法务和合规团队,用于上线审批和后续审计。
这样做的重点不是让 AI “更聪明”,而是让企业知道 AI 在什么条件下会出错,并在出错前多一道防线。
它和 Meta 是什么关系
截至 2026 年 6 月 26 日,公开信息显示,Meta 和 Virtue AI 的关系主要是人才与团队层面的加入,不应简单写成 Meta 收购了 Virtue AI。
Axios 在 2026 年 6 月 25 日报道称,Meta Superintelligence Labs 正在聘用 Virtue AI 的三位联合创始人 Bo Li、Dawn Song、Sanmi Koyejo,以及 Virtue AI 更广泛团队中的一些成员。报道还提到,这些人会参与 Meta 的 AI 安全、AI Agent 安全和可信系统建设,但交易或安排条款没有公开。
这件事的背景是 Meta 正在加强 Superintelligence Labs,并补强 AI 安全能力。对 Meta 来说,Virtue AI 团队的价值在于他们长期研究对抗机器学习、LLM 风险评估、红队测试和 Agent 安全;对行业来说,这说明大模型竞争不只在模型能力,也在安全、防护、合规和 Agent 控制能力。
所以可以这样理解:
- Virtue AI 本身是一家企业 AI 安全平台公司。
- Meta 不是 Virtue AI 官网产品的使用入口。
- 公开报道里没有明确说 Meta 收购了 Virtue AI。
- 最新关系是 Virtue AI 的多位核心成员加入 Meta Superintelligence Labs,帮助 Meta 做 AI 安全和 AI Agent 安全。
为什么这家公司值得关注
Virtue AI 值得关注,主要因为它踩中了两个趋势。
第一个趋势是企业 AI 从“对话”走向“行动”。Agent 可以调用工具、执行代码、读写数据、改工单、发邮件,风险也从错误回答升级为错误操作。传统内容审核不够用了,企业需要对 Agent 的每一步动作做权限控制和实时拦截。
第二个趋势是 AI 安全开始产品化。过去很多风险评估停留在论文、benchmark 或一次性测试报告里。Virtue AI 的方向是把红队测试、guardrails、合规框架、审计报告和部署能力做成企业平台,让安全团队能持续使用。
当然,它也不是所有人的必需品。中小团队如果只是做一个低风险内部工具,可能先用模型服务商自带 moderation、权限隔离、日志审计和人工复核就够了。只有当 AI 系统开始接入真实业务、敏感数据和自动化动作时,Virtue AI 这类平台的价值才会更明显。