Google first introduces its agentic AI- Gemini Spark

谷歌首次推出AI代理人產品 Gemini Spark，我們比較了一下跟 OpenClaw的不同

May 20, 2026

∙ Paid

今年大會的核心主軸宣告 Google 正式跨入「Agentic Era（AI 智慧體/代理人時代）」。Google 透過底層晶片、基礎大模型以及產品架構的全面革新，讓 AI 從過去單純的「回答問題（Text predicting）」演進為能主動、跨多工替使用者「執行任務（Act on your behalf）」的個人與企業級代理人。

以下為大會的四大核心板塊解析與關鍵時間點整理：

一、算力與底層模型架構的超進化（Hyper Progress）

Google 強調其具備從晶片、基礎設施、模型研發到大眾終端產品的「全棧式（Full Stack）」優化能力，這是推動 AI 代理人運行的基石。

基礎基礎設施與 Capex 投入: Google 的資本支出（Capex）從 2022 年的 310 億美元，預計在今年增長約 6 倍，達到 1,800 億至 1,900 億美元。月活躍用戶年增近倍達9億人。

第八代自研晶片 TPU 8T 與 8I:

首次採用雙晶片策略，區分訓練與推理架構。

TPU 8T（訓練優化）：專為大規模預訓練設計，算力較前代提升近 3 倍。透過 Jax 和 Pathways 技術，訓練不再受限於單一資料中心，可全球跨點協同調度超過 100 萬顆 TPU，讓大型模型訓練時間由「幾個月縮短至幾週」。

TPU 8I（推理優化）：極大化降低延遲，影片中展示在運行 Flash 模型時，推理速度高達每秒近 1,500 個 tokens。

Gemini Omni 系列大模型首發

Gemini Omni Flash 於當天正式上線。這是一套原生多模態（Native Multimodal）的「世界模型（World Model）」，不僅能看懂世界，還具備直覺的物理常識（如動能、重力模擬）。

影片生成與對話式編輯：使用者可以給予影片（如自拍照）並透過對話直接修改現實場景（如將背景變為黑洞、水面映射效果），徹底顛覆影像創作流程。

Gemini 3.5 家族登場

谷歌正式推出 Gemini 3.5 Flash。在各項基準測試（特別是程式碼編寫與代表真實世界經濟價值的 SWE-bench/SWE-agent 任務上）全面超越原先的 3.1 Pro，且運算速度是其他頂尖模型的 4 倍。

預告 Gemini 3.5 Pro 將於下個月（2026 年 6 月）推出。

二、 Anti-Gravity 2.0：無與倫比的 AI 程式開發平台

Agent-First 開發範式：Google 推出全新獨立桌面應用程式 Anti-Gravity 2.0，這是一個徹底以「AI 代理人為核心」的開發環境（IDE），支援子代理人（Sub-agents）團隊協作、非同步任務管理。

驚人的實證：12 小時內從零建構作業系統，大會展示了利用 Gemini 3.5 Flash 配合 Anti-Gravity，在完全沒有既有程式碼的空白專案下，指揮 93 個 AI 子代理人平行協作。在歷時 12 小時、發出超過 15,000 次模型請求、處理 26 億個 token 後，AI 獨立寫出了包含排程器、記憶體管理、檔案系統在內的完整作業系統核心（OS Kernel），且花費的 API 額度不到 1,000 美元。現場甚至成功在該 OS 上編譯並運行了經典遊戲《Doom（毀滅戰士）》。

Andrew Lu on global semis and techs