Gemini 3.5 正式發布:Flash 先行,Google 把重點放在 Agent 和長任務執行

Google 發布 Gemini 3.5 系列,首先推出 Gemini 3.5 Flash,強調 Agent 工作流、程式碼能力、多模態 UI 生成、企業自動化和個人 AI 代理 Gemini Spark。

Google 在 2026 年 5 月 20 日正式發布 Gemini 3.5 系列。第一款開放使用的是 Gemini 3.5 Flash,定位不是單純的聊天模型,而是面向 Agent、程式碼生成和長時間複雜任務執行的模型。

從這次公告看,Google 對 Gemini 3.5 的敘事很明確:模型不只要回答問題,還要能規劃、執行、檢查,並在多步驟任務中持續推進工作。

Gemini 3.5 Flash 先行

Gemini 3.5 Flash 已經面向多類使用者開放:

  • 一般使用者可以透過 Gemini 應用程式和 Google 搜尋中的 AI 模式體驗。
  • 開發者可以透過 Google Antigravity、Google AI Studio、Android Studio 中的 Gemini API 使用。
  • 企業使用者可以透過 Gemini Enterprise Agent Platform 和 Gemini Enterprise 使用。

Google 同時提到,Gemini 3.5 Pro 仍在開發中,已經在 Google 內部使用,計畫在下個月推出。

這說明 3.5 系列會繼續保留 Flash 與 Pro 的分層:Flash 更強調速度、成本和可規模化執行,Pro 則更可能面向更複雜、更高能力需求的場景。

重點是 Agent 和程式碼任務

Google 把 Gemini 3.5 Flash 稱為目前最強的 Agent 與程式碼編寫模型之一。公告中提到,它在多項程式碼和 Agent 基準測試中超過 Gemini 3.1 Pro 的部分成績,例如 Terminal-Bench 2.1、GDPval-AA、MCP Atlas 和 CharXiv Reasoning。

這些指標本身不是一般使用者最需要關心的內容。更重要的是,Google 正在把模型能力往「可執行工作流」上集中:不僅能寫程式碼,還能處理舊專案遷移、複雜應用開發、財務報表整理、資料分析和持續測試。

在 Antigravity 開發架構中,Gemini 3.5 Flash 可以透過多個協作子代理處理大型任務。Google 展示的例子包括解析 AlphaZero 論文並實作可玩的遊戲、把舊版程式碼轉換為 Next.js、並行生成城市景觀和 UI 方案。

這類能力的方向很清楚:AI 編程工具正在從「生成一段程式碼」走向「組織多個 Agent 完成一個專案」。

多模態 UI 與圖形能力增強

Gemini 3.5 Flash 繼承了 Gemini 3 的多模態基礎。Google 強調它可以生成更豐富的網頁 UI、互動動畫和圖形內容。

公告中給出的應用場景包括:

  • 為研究論文生成互動式動畫。
  • 根據文字描述生成互動式硬體模型。
  • 為學校募款活動生成完整品牌概念。
  • 在短時間內為結帳流程生成多種 UX 方案。

這部分對開發者和產品團隊很有意義。模型不再只是輸出文字說明,而是能參與前端原型、互動設計和視覺化內容生成。

企業場景:把耗時流程自動化

Google 在公告中列舉了多個合作夥伴案例。Shopify 使用子代理分析複雜資料並預測商家成長;Macquarie Bank 測試用 3.5 Flash 閱讀超過 100 頁的複雜文件,加速開戶流程;Salesforce 將其整合到 Agentforce;Ramp 用它改進複雜發票 OCR;Xero 用 AI 代理處理行政流程;Databricks 用自動化工作流監控資料異常並給出修復建議。

這些案例共同指向一個趨勢:企業採用大模型時,關注點正在從單次問答轉向流程自動化。模型是否便宜、快、能長時間穩定執行,會比單次回答是否驚豔更重要。

Gemini Spark:個人 AI 代理

Google 還公布了 Gemini Spark。它是由 Gemini 3.5 Flash 驅動的個人 AI 代理,目標是在使用者引導下長期運行並主動執行任務。

Gemini Spark 已經開始面向受信任測試人員推出,Google 計畫在下週向美國 Google AI Ultra 訂閱使用者開放 Beta 測試。

這部分值得關注。Google 搜尋、Gemini 應用程式、Android、Workspace 和瀏覽器生態本來就覆蓋大量個人數位生活場景。如果個人 Agent 能與這些入口結合,影響可能比單獨的聊天機器人更大。

安全機制繼續前移

Google 表示 Gemini 3.5 按照 Frontier Safety Framework 開發,並強化了資訊安全和 CBRN 相關防護。公告還提到使用可解釋性工具,在模型給出回答前協助檢查和理解推理過程。

這說明前沿模型的發布已經不只是能力競賽。越是強調 Agent、自動執行和長任務,安全控制、誤拒率、有害輸出防護和可解釋性就越重要。

怎麼看 Gemini 3.5

Gemini 3.5 Flash 的意義不只是「又一個新模型發布」。它更像是 Google 對下一階段 AI 產品形態的集中押注:模型要能調用工具、拆分任務、協作執行、生成 UI,並進入個人和企業工作流。

對開發者來說,值得關注的是 Google Antigravity、AI Studio、Gemini API 和 Android Studio 中的實際體驗。對企業來說,重點是它能否在真實流程中穩定減少人工操作,而不是只看 benchmark。

Gemini 3.5 Pro 還沒有正式開放。等 Pro 發布後,Flash 與 Pro 在能力、價格、速度和上下文處理上的差異,才會決定它們各自更適合哪些生產場景。

參考來源:

记录并分享
使用 Hugo 建立
主題 StackJimmy 設計