Google first introduces its agentic AI- Gemini Spark
谷歌首次推出AI代理人產品 Gemini Spark,我們比較了一下跟 OpenClaw的不同
今年大會的核心主軸宣告 Google 正式跨入「Agentic Era(AI 智慧體/代理人時代)」。Google 透過底層晶片、基礎大模型以及產品架構的全面革新,讓 AI 從過去單純的「回答問題(Text predicting)」演進為能主動、跨多工替使用者「執行任務(Act on your behalf)」的個人與企業級代理人。
以下為大會的四大核心板塊解析與關鍵時間點整理:
一、 算力與底層模型架構的超進化(Hyper Progress)
Google 強調其具備從晶片、基礎設施、模型研發到大眾終端產品的「全棧式(Full Stack)」優化能力,這是推動 AI 代理人運行的基石。
基礎基礎設施與 Capex 投入: Google 的資本支出(Capex)從 2022 年的 310 億美元,預計在今年增長約 6 倍,達到 1,800 億至 1,900 億美元。月活躍用戶年增近倍達9億人。
第八代自研晶片 TPU 8T 與 8I:
首次採用雙晶片策略,區分訓練與推理架構。
TPU 8T(訓練優化): 專為大規模預訓練設計,算力較前代提升近 3 倍。透過 Jax 和 Pathways 技術,訓練不再受限於單一資料中心,可全球跨點協同調度超過 100 萬顆 TPU,讓大型模型訓練時間由「幾個月縮短至幾週」。
TPU 8I(推理優化): 極大化降低延遲,影片中展示在運行 Flash 模型時,推理速度高達每秒近 1,500 個 tokens。
Gemini Omni 系列大模型首發
Gemini Omni Flash 於當天正式上線。這是一套原生多模態(Native Multimodal)的「世界模型(World Model)」,不僅能看懂世界,還具備直覺的物理常識(如動能、重力模擬)。
影片生成與對話式編輯: 使用者可以給予影片(如自拍照)並透過對話直接修改現實場景(如將背景變為黑洞、水面映射效果),徹底顛覆影像創作流程。
Gemini 3.5 家族登場
谷歌正式推出 Gemini 3.5 Flash。在各項基準測試(特別是程式碼編寫與代表真實世界經濟價值的 SWE-bench/SWE-agent 任務上)全面超越原先的 3.1 Pro,且運算速度是其他頂尖模型的 4 倍。
預告 Gemini 3.5 Pro 將於下個月(2026 年 6 月)推出。
二、 Anti-Gravity 2.0:無與倫比的 AI 程式開發平台
Agent-First 開發範式:Google 推出全新獨立桌面應用程式 Anti-Gravity 2.0,這是一個徹底以「AI 代理人為核心」的開發環境(IDE),支援子代理人(Sub-agents)團隊協作、非同步任務管理。
驚人的實證:12 小時內從零建構作業系統,大會展示了利用 Gemini 3.5 Flash 配合 Anti-Gravity,在完全沒有既有程式碼的空白專案下,指揮 93 個 AI 子代理人平行協作。在歷時 12 小時、發出超過 15,000 次模型請求、處理 26 億個 token 後,AI 獨立寫出了包含排程器、記憶體管理、檔案系統在內的完整作業系統核心(OS Kernel),且花費的 API 額度不到 1,000 美元。現場甚至成功在該 OS 上編譯並運行了經典遊戲《Doom(毀滅戰士)》。


