Google 还没有正式发布 Gemini Spark。
目前关于它的信息,主要来自 Gemini Web 内部测试界面、社区截图、TestingCatalog 报道,以及 36Kr / 新智元对相关爆料的整理。比较一致的说法是:Gemini Spark BETA 可能是 Google 正在准备的全天候 AI Agent,定位不再只是聊天助手,而是能在后台处理邮件、在线任务和多步骤工作流的“日常 AI 代理”。
所以这篇文章先把边界说清楚:这是爆料解读,不是 Google 官方发布稿。所有功能、命名和上线时间,都要等 Google 正式公告确认。
先说结论
从目前曝光的信息看,Gemini Spark 有三个重点:
- 它可能是 Gemini 体系里的 24 小时在线 Agent,而不是普通聊天模型。
- 它会调用更广泛的个人上下文,包括 Google 应用、聊天记录、任务、登录网站和位置信息等。
- 它的风险和吸引力一样大,因为它可能涉及信息分享、远程浏览器数据、购买动作和第三方服务调用。
如果 Google 真把 Spark 推出来,Gemini 的定位会发生变化:从“回答问题的 AI”变成“替你持续处理事务的 AI”。
Gemini Spark 是什么
TestingCatalog 在 2026 年 5 月 14 日报道,Google 正在 Gemini Web 中测试 Gemini Spark BETA。曝光的欢迎文案把它描述成一个 everyday AI agent,可以 24/7 帮用户处理 inbox、online tasks 和更多多步骤工作。
36Kr / 新智元的文章也提到,Spark 被扒出后,外界看到的是一个“全时 Agent”方向:它可以全天候待命,处理收件箱、执行在线任务,甚至可能涉及购买和信息分享。
这意味着 Spark 不是一个单纯的新模型名。它更像是 Gemini 产品层的一次升级:让 Gemini 从对话窗口里走出来,进入用户的邮件、网页、日程、任务和跨应用工作流。
它可能怎么工作
根据 TestingCatalog 披露的隐藏 onboarding 文案,Gemini Spark 会从多种来源获取上下文,包括:
- Connected Apps。
- skills。
- chats。
- tasks。
- 用户登录过的网站。
- Personal intelligence。
- location。
这些信息会帮助 Spark 理解用户想完成什么,并在执行任务时调用必要的上下文。文案还提到,为了完成某些动作,Gemini 可能会把必要信息分享给第三方,例如姓名、联系方式、文件、偏好,以及用户可能认为敏感的信息。
如果这些描述最终属实,Spark 的工作方式会更接近“带上下文的代理系统”,而不是一次性问答。它不是只看当前一句 prompt,而是可能综合长期偏好、连接应用、浏览器状态和任务历史。
为什么它重要
Gemini Spark 的关键,不在于多一个聊天入口,而在于 Google 有天然的生态入口。
OpenAI 和 Anthropic 可以做很强的 Agent,但它们很难天然拥有 Gmail、Calendar、Drive、Chrome、Android、Workspace 这条完整链路。Google 如果把 Spark 接进这些产品,用户不需要额外搭建太多工作流,就能让 Agent 进入日常事务。
这会带来三个变化。
第一,Gemini 会从被动问答变成主动执行。用户不再只是问“帮我总结这封邮件”,而是可能让它持续整理 inbox、追踪任务和执行后续动作。
第二,Agent 会更依赖个人上下文。它越懂你的邮件、日程、文件、浏览器状态和偏好,越可能给出有用结果。
第三,权限边界会变得更敏感。能做更多事,也意味着需要更清楚地知道它什么时候能做、能做到哪一步、是否需要确认。
风险点在哪里
TestingCatalog 披露的文案里,有几处很值得关注。
第一,Spark 是 experimental。也就是说,即便它上线,也不应被当成完全成熟、无需监督的系统。
第二,虽然系统设计上会在敏感操作前征求许可,但文案也提示,它可能会在未经询问的情况下分享信息或完成购买。
第三,为了保持会话连续性,Gemini 会保存 remote browser data,比如登录细节和 remote code execution data。用户可以在 Settings 中清除这些数据,也可以关闭 Connected Apps 和 Personal intelligence 相关能力。
这几个点合在一起,说明 Spark 的产品方向很激进:它要做真正能执行任务的 Agent,而不是只生成建议。但越接近真实执行,越需要严格的权限、审计、确认和回滚机制。
和 Remy、AI Ultra 的关系
TestingCatalog 提到,Spark 可能是此前内部代号 Remy 的 agentic Gemini upgrade 的重命名版本,也与面向 Google AI Ultra 订阅用户的 Gemini Agent 方向有关。
如果这个线索成立,Spark 可能不是凭空出现的新项目,而是 Google 把此前较高阶、较封闭的 Agent 能力重新包装,并准备推向更大范围用户。
36Kr / 新智元也把它描述成从 “Remy” 到 “Spark” 的升级:Gemini Agent 不再只是一个功能,而是要走向 24/7 的数字生活管家。
不过这仍然是基于爆料信息的判断。Google 是否会使用 Spark 这个正式名称、是否只面向 AI Ultra、是否推出更轻量订阅层,还要等官方确认。
MCP、skills 和工具生态
同一批社区截图里,还出现了 MCP Tool Testing 这类模型选择器入口。36Kr 文章认为,这可能暗示新 Gemini 会原生支持 MCP 第三方工具接入,Thinking 模式也会重构。
这条线索和 Spark 放在一起看,很有意思。
如果 Spark 只是“会聊天的助手”,skills 和 MCP 的意义有限。但如果 Spark 是一个长期运行的 Agent,它就需要可靠地调用工具、访问网页、执行任务、读写上下文,并把结果交付给用户。
也就是说,Spark 可能不是单点功能,而是 Google Agent 工具生态的一部分:模型负责理解和规划,skills / MCP / connected apps 负责执行和扩展。
对普通用户意味着什么
如果 Gemini Spark 真的发布,普通用户最直接的变化可能是:
- 邮件不只是被总结,而是可以被分类、跟进和转成任务。
- 网页任务不只是给建议,而是可能在远程浏览器中持续执行。
- 日程、位置、偏好和历史对话会变成 Agent 的长期上下文。
- 购买、预订、表单填写等动作可能进入 AI 执行范围。
这听起来很方便,但用户需要建立新的习惯:不再只看 AI 说了什么,还要看 AI 准备做什么、已经做了什么、能不能撤回、有没有记录。
未来 AI Agent 的体验好不好,可能不只取决于模型聪不聪明,还取决于权限提示是否清楚、任务日志是否可查、错误操作能不能恢复。
对开发者和团队意味着什么
对开发者来说,Spark 的意义在于 Google 可能正在把 Agent 从“演示产品”推向真实工作流平台。
如果 Spark 能稳定连接 Google 应用、第三方工具和浏览器状态,那么开发者会关心:
- API 或扩展机制是否开放。
- MCP 或 skills 是否可由第三方接入。
- 企业管理员能否控制权限、数据留存和审计。
- Agent 执行失败时是否有可追踪日志。
- 是否支持沙盒、审批流和敏感操作确认。
对团队来说,Spark 可能会先从 Gmail、Calendar、Docs、Drive、Chrome 这类高频场景切入。它未必一开始就适合完全自动化高风险业务,但很适合作为 inbox triage、会议跟进、资料整理、市场研究和轻量运营任务的助手。
现在应该怎么看
这条消息适合用“高可信方向,低确定细节”来理解。
高可信方向是:Google 确实在推进更主动、更长期运行、更深度接入生态的 Gemini Agent。TestingCatalog 报道的 Gemini Web 测试文案、社区截图和 36Kr 整理的多方爆料,都指向同一个方向。
低确定细节是:正式名称、上线时间、权限规则、订阅层级、可用地区、是否开放 API、是否真的叫 Gemini Spark,都还不能下结论。
所以现在最稳妥的判断是:
- 不要把 Spark 当成已经发布的正式产品。
- 可以把它视为 Google 下一阶段 AI Agent 路线的强信号。
- 真正值得等的是官方如何解释权限、隐私、第三方数据分享和远程浏览器数据保存。
总结
Gemini Spark 如果最终发布,可能会是 Gemini 从聊天助手走向全天候 Agent 的关键一步。它不只是换一个模型,而是把 Gemini 放进 Google 生态的邮件、网页、任务、位置、个人智能和第三方服务里。
它的潜力很大:更主动、更贴近真实工作流,也更容易借助 Google 的生态分发给大量用户。它的风险也同样大:一旦 AI 能分享信息、保存浏览器状态、执行购买和调用第三方服务,权限边界就必须非常清楚。
所以 Gemini Spark 最值得关注的不是“它有多聪明”,而是 Google 准备怎样让一个 24 小时在线的 AI Agent 变得可控、可审计、可信任。
参考链接: