<?xml version="1.0" encoding="utf-8" standalone="yes"?>
<rss version="2.0" xmlns:atom="http://www.w3.org/2005/Atom">
    <channel>
        <title>Virtue AI on KnightLi的博客</title>
        <link>https://knightli.com/tags/virtue-ai/</link>
        <description>Recent content in Virtue AI on KnightLi的博客</description>
        <generator>Hugo -- gohugo.io</generator>
        <language>zh-cn</language>
        <lastBuildDate>Fri, 26 Jun 2026 10:59:53 +0800</lastBuildDate><atom:link href="https://knightli.com/tags/virtue-ai/index.xml" rel="self" type="application/rss+xml" /><item>
        <title>Virtue AI 是什么：企业 AI 安全平台、使用方法与 Meta 关系</title>
        <link>https://knightli.com/2026/06/26/virtue-ai-enterprise-ai-security-meta/</link>
        <pubDate>Fri, 26 Jun 2026 10:59:53 +0800</pubDate>
        
        <guid>https://knightli.com/2026/06/26/virtue-ai-enterprise-ai-security-meta/</guid>
        <description>&lt;p&gt;Virtue AI 是一家面向企业的 AI 安全公司，重点不是再做一个聊天机器人，而是给企业已有的模型、应用和 AI Agent 加一层安全、治理和合规能力。&lt;/p&gt;
&lt;p&gt;简单说，它想解决的是：企业开始把 AI 接到客服、代码、知识库、财务、内部流程和自动化 Agent 之后，怎么持续发现风险、拦截违规行为，并留下可以审计的证据。&lt;/p&gt;
&lt;p&gt;官网把 Virtue AI 定位为 enterprise AI safety platform，核心能力包括自动化红队测试、实时 guardrails、Agent 行为防护、AI 治理和合规报告。它更像企业安全团队、AI 平台团队和合规团队使用的基础设施，而不是普通个人用户每天打开来聊天的工具。&lt;/p&gt;
&lt;p&gt;项目地址：&lt;/p&gt;
&lt;div class=&#34;highlight&#34;&gt;&lt;div class=&#34;chroma&#34;&gt;
&lt;table class=&#34;lntable&#34;&gt;&lt;tr&gt;&lt;td class=&#34;lntd&#34;&gt;
&lt;pre tabindex=&#34;0&#34; class=&#34;chroma&#34;&gt;&lt;code&gt;&lt;span class=&#34;lnt&#34;&gt;1
&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/td&gt;
&lt;td class=&#34;lntd&#34;&gt;
&lt;pre tabindex=&#34;0&#34; class=&#34;chroma&#34;&gt;&lt;code class=&#34;language-text&#34; data-lang=&#34;text&#34;&gt;&lt;span class=&#34;line&#34;&gt;&lt;span class=&#34;cl&#34;&gt;https://www.virtueai.com/
&lt;/span&gt;&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/td&gt;&lt;/tr&gt;&lt;/table&gt;
&lt;/div&gt;
&lt;/div&gt;&lt;h2 id=&#34;virtue-ai-主要做什么&#34;&gt;Virtue AI 主要做什么
&lt;/h2&gt;&lt;p&gt;Virtue AI 的产品线可以分成四类。&lt;/p&gt;
&lt;p&gt;第一类是 VirtueRed，用来做持续自动化红队测试。企业可以用它测试 AI 应用、模型和 Agent 是否容易出现越狱、提示词注入、隐私泄露、幻觉、偏见、违规输出等问题。它的意义在于把一次性的安全评测变成持续扫描，适合模型、提示词、RAG 数据和业务逻辑经常变化的系统。&lt;/p&gt;
&lt;p&gt;第二类是 VirtueGuard，用来做实时安全拦截。它可以放在聊天应用、Agent Gateway、RAG 管线、上传审核流程或模型调用前后，对文本、代码、图片、视频和音频做安全判断。常见用法是检查用户输入、模型输出、上传内容、生成内容和 AI 生成代码。&lt;/p&gt;
&lt;p&gt;第三类是 AgentSuite-Red，用来专门测试 AI Agent。传统 LLM 安全更多关注“模型说了什么”，但 Agent 还会调用工具、读写文件、访问 API、发送消息、执行代码。AgentSuite-Red 提供沙箱环境、攻击任务和自动评测，用来测试 Agent 在直接提示词注入、间接提示词注入和恶意工具场景下是否会失控。&lt;/p&gt;
&lt;p&gt;第四类是 AgentSuite-Blue，用来保护正在运行的 Agent。它包含 MCP Guard、Skill Guard、Prompt Guard、Action Guard、访问控制、Shadow AI 检测和可观测性。重点是发现企业里未授权使用的 AI 工具，扫描 MCP 工具和 Agent 技能里的隐藏注入，监控工具调用，在高风险动作真正执行前拦截。&lt;/p&gt;
&lt;h2 id=&#34;它适合谁&#34;&gt;它适合谁
&lt;/h2&gt;&lt;p&gt;Virtue AI 更适合以下团队：&lt;/p&gt;
&lt;ol&gt;
&lt;li&gt;已经在生产环境使用 LLM、RAG 或 AI Agent 的企业。&lt;/li&gt;
&lt;li&gt;有金融、医疗、保险、IT、客服、代码生成等高风险 AI 场景的团队。&lt;/li&gt;
&lt;li&gt;需要满足 EU AI Act、GDPR、OWASP LLM Top 10、NIST AI RMF、MITRE、FINRA 等框架的组织。&lt;/li&gt;
&lt;li&gt;想把 AI 安全测试接入 CI/CD、上线审批和安全审计流程的团队。&lt;/li&gt;
&lt;li&gt;担心员工绕过审批使用外部 AI 工具，也就是 Shadow AI 问题的安全团队。&lt;/li&gt;
&lt;/ol&gt;
&lt;p&gt;如果只是个人想找一个 AI 聊天工具，Virtue AI 不是最合适的入口。它的价值主要出现在企业已经有 AI 应用，并且需要统一治理的时候。&lt;/p&gt;
&lt;h2 id=&#34;怎么用-virtue-ai&#34;&gt;怎么用 Virtue AI
&lt;/h2&gt;&lt;p&gt;Virtue AI 的使用方式不是“注册后直接问问题”，而是围绕企业 AI 系统做接入。&lt;/p&gt;
&lt;p&gt;典型流程如下。&lt;/p&gt;
&lt;ol&gt;
&lt;li&gt;先确定要保护什么：聊天机器人、RAG 系统、代码助手、内部 Agent、MCP 工具、文件上传流程，还是已有模型 API。&lt;/li&gt;
&lt;li&gt;如果要先发现风险，用 VirtueRed 或 AgentSuite-Red 做红队测试，生成风险报告，定位越狱、注入、隐私泄露、违规输出和 Agent 工具滥用问题。&lt;/li&gt;
&lt;li&gt;如果要上线拦截，把 VirtueGuard 或 AgentSuite-Blue 接到请求链路里，对输入、输出、工具调用和 Agent 动作做实时判断。&lt;/li&gt;
&lt;li&gt;如果企业有自定义合规规则，可以用 PolicyGuard 这类能力把内部政策、行业要求和监管条款转成可执行 guardrails。&lt;/li&gt;
&lt;li&gt;上线后继续看仪表盘、报告和审计记录，把新的风险测试结果重新反馈到策略里。&lt;/li&gt;
&lt;/ol&gt;
&lt;p&gt;从文档看，VirtueGuard 支持 REST API，认证方式包括 API key 或 JWT bearer token。它也支持 SaaS、Docker Compose、Helm/Kubernetes 和 Terraform/IaC 等部署方式。也就是说，企业可以先用托管服务验证，再根据数据合规要求部署到私有云或本地环境。&lt;/p&gt;
&lt;p&gt;Virtue AI 官网还强调可以接入 OpenAI、Google、LangChain、Claude Code 等常见模型和 Agent 工具链。AgentSuite-Blue 文档里也提到可以通过 hook 或 gateway 接入已有 Web Agent、桌面 Agent 和基于 OpenAI Agents SDK、Anthropic Claude SDK、Google ADK、LangChain 等框架构建的自定义 Agent。&lt;/p&gt;
&lt;h2 id=&#34;一个更具体的接入例子&#34;&gt;一个更具体的接入例子
&lt;/h2&gt;&lt;p&gt;假设企业内部有一个客服 RAG 机器人，已经接入了产品文档和用户账户信息。Virtue AI 可以这样用：&lt;/p&gt;
&lt;ol&gt;
&lt;li&gt;用 VirtueRed 扫描机器人，测试它是否会泄露隐私、编造政策、绕过权限或回答不该回答的问题。&lt;/li&gt;
&lt;li&gt;用 VirtueGuard 检查用户输入和模型输出，发现违规内容后选择阻断、改写、报警或转人工。&lt;/li&gt;
&lt;li&gt;如果客服机器人会调用工具，例如查订单、改地址、退款，就用 AgentSuite-Blue 监控这些动作，避免被提示词注入诱导执行高风险操作。&lt;/li&gt;
&lt;li&gt;把扫描报告和拦截记录交给安全、法务和合规团队，用于上线审批和后续审计。&lt;/li&gt;
&lt;/ol&gt;
&lt;p&gt;这样做的重点不是让 AI “更聪明”，而是让企业知道 AI 在什么条件下会出错，并在出错前多一道防线。&lt;/p&gt;
&lt;h2 id=&#34;它和-meta-是什么关系&#34;&gt;它和 Meta 是什么关系
&lt;/h2&gt;&lt;p&gt;截至 2026 年 6 月 26 日，公开信息显示，Meta 和 Virtue AI 的关系主要是人才与团队层面的加入，不应简单写成 Meta 收购了 Virtue AI。&lt;/p&gt;
&lt;p&gt;Axios 在 2026 年 6 月 25 日报道称，Meta Superintelligence Labs 正在聘用 Virtue AI 的三位联合创始人 Bo Li、Dawn Song、Sanmi Koyejo，以及 Virtue AI 更广泛团队中的一些成员。报道还提到，这些人会参与 Meta 的 AI 安全、AI Agent 安全和可信系统建设，但交易或安排条款没有公开。&lt;/p&gt;
&lt;p&gt;这件事的背景是 Meta 正在加强 Superintelligence Labs，并补强 AI 安全能力。对 Meta 来说，Virtue AI 团队的价值在于他们长期研究对抗机器学习、LLM 风险评估、红队测试和 Agent 安全；对行业来说，这说明大模型竞争不只在模型能力，也在安全、防护、合规和 Agent 控制能力。&lt;/p&gt;
&lt;p&gt;所以可以这样理解：&lt;/p&gt;
&lt;ol&gt;
&lt;li&gt;Virtue AI 本身是一家企业 AI 安全平台公司。&lt;/li&gt;
&lt;li&gt;Meta 不是 Virtue AI 官网产品的使用入口。&lt;/li&gt;
&lt;li&gt;公开报道里没有明确说 Meta 收购了 Virtue AI。&lt;/li&gt;
&lt;li&gt;最新关系是 Virtue AI 的多位核心成员加入 Meta Superintelligence Labs，帮助 Meta 做 AI 安全和 AI Agent 安全。&lt;/li&gt;
&lt;/ol&gt;
&lt;h2 id=&#34;为什么这家公司值得关注&#34;&gt;为什么这家公司值得关注
&lt;/h2&gt;&lt;p&gt;Virtue AI 值得关注，主要因为它踩中了两个趋势。&lt;/p&gt;
&lt;p&gt;第一个趋势是企业 AI 从“对话”走向“行动”。Agent 可以调用工具、执行代码、读写数据、改工单、发邮件，风险也从错误回答升级为错误操作。传统内容审核不够用了，企业需要对 Agent 的每一步动作做权限控制和实时拦截。&lt;/p&gt;
&lt;p&gt;第二个趋势是 AI 安全开始产品化。过去很多风险评估停留在论文、benchmark 或一次性测试报告里。Virtue AI 的方向是把红队测试、guardrails、合规框架、审计报告和部署能力做成企业平台，让安全团队能持续使用。&lt;/p&gt;
&lt;p&gt;当然，它也不是所有人的必需品。中小团队如果只是做一个低风险内部工具，可能先用模型服务商自带 moderation、权限隔离、日志审计和人工复核就够了。只有当 AI 系统开始接入真实业务、敏感数据和自动化动作时，Virtue AI 这类平台的价值才会更明显。&lt;/p&gt;
&lt;h2 id=&#34;参考资料&#34;&gt;参考资料
&lt;/h2&gt;&lt;ul&gt;
&lt;li&gt;&lt;a class=&#34;link&#34; href=&#34;https://www.virtueai.com/&#34;  target=&#34;_blank&#34; rel=&#34;noopener&#34;
    &gt;Virtue AI 官网&lt;/a&gt;&lt;/li&gt;
&lt;li&gt;&lt;a class=&#34;link&#34; href=&#34;https://www.virtueai.com/virtue-ai-team&#34;  target=&#34;_blank&#34; rel=&#34;noopener&#34;
    &gt;Virtue AI About 页面&lt;/a&gt;&lt;/li&gt;
&lt;li&gt;&lt;a class=&#34;link&#34; href=&#34;https://docs.virtueai.com/virtueguard&#34;  target=&#34;_blank&#34; rel=&#34;noopener&#34;
    &gt;VirtueGuard 文档&lt;/a&gt;&lt;/li&gt;
&lt;li&gt;&lt;a class=&#34;link&#34; href=&#34;https://docs.virtueai.com/virtuered&#34;  target=&#34;_blank&#34; rel=&#34;noopener&#34;
    &gt;VirtueRed 文档&lt;/a&gt;&lt;/li&gt;
&lt;li&gt;&lt;a class=&#34;link&#34; href=&#34;https://docs.virtueai.com/agentsuite-red&#34;  target=&#34;_blank&#34; rel=&#34;noopener&#34;
    &gt;AgentSuite-Red 文档&lt;/a&gt;&lt;/li&gt;
&lt;li&gt;&lt;a class=&#34;link&#34; href=&#34;https://docs.virtueai.com/virtueagent/&#34;  target=&#34;_blank&#34; rel=&#34;noopener&#34;
    &gt;AgentSuite-Blue 文档&lt;/a&gt;&lt;/li&gt;
&lt;li&gt;&lt;a class=&#34;link&#34; href=&#34;https://www.axios.com/2026/06/25/meta-hires-virtue-ai-founders-security&#34;  target=&#34;_blank&#34; rel=&#34;noopener&#34;
    &gt;Axios：Meta hires Virtue AI founders&lt;/a&gt;&lt;/li&gt;
&lt;li&gt;&lt;a class=&#34;link&#34; href=&#34;https://www.axios.com/2025/04/15/virtue-ai-lightspeed-walden-catalyst-funding&#34;  target=&#34;_blank&#34; rel=&#34;noopener&#34;
    &gt;Axios：Virtue AI raises $30M&lt;/a&gt;&lt;/li&gt;
&lt;/ul&gt;
</description>
        </item>
        
    </channel>
</rss>
