42.5Exaflops:谷歌新TPU性能超越最強超算24倍,智能體協作協議A2A出爐
第七代 TPU 來了。
AI 算力又迎來了新的標桿。
本周三,谷歌正式發布了旗下第七代張量處理單元(TPU)Ironwood。谷歌稱,在大規模部署的情況下,這款 AI 加速器的計算能力能達到全球最快超級計算機的 24 倍以上。
這款在 Google Cloud Next '25 大會上發布的新芯片代表著谷歌十年來 AI 芯片研發戰略的重大轉折:谷歌自研的前幾代 TPU 主要面向 AI 的訓練和推理工作負載,而 Ironwood 是第一款專為推理而設計的芯片。
谷歌副總裁兼機器學習、系統和云 AI 總經理 Amin Vahdat 表示:「Ironwood 旨在支持生成式 AI 的下一階段及其巨大的計算和通信需求。這就是我們所說的『推理時代』,AI 代理將主動檢索和生成數據,以協作方式提供洞察和答案,而不僅僅是數據。」
突破壁壘,最大 42.5 exaflops 算力
Ironwood 擁有超模的技術規格,當每個 pod 擴展至 9216 塊芯片時,它可提供 42.5 exaflops 的 AI 算力,遠超目前全球最快的超級計算機 El Capitan 的 1.7 exaflops。每塊 Ironwood 芯片的峰值計算能力可達 4614 TFLOPs。
在單芯片規格上,Ironwood 顯著提升了內存和帶寬,每塊芯片配備 192GB 高帶寬內存(HBM),是去年發布的上一代 TPU Trillium 的六倍。每塊芯片的內存帶寬達到 7.2 terabits/s,是 Trillium 的 4.5 倍。
在數據中心規模擴大,供電逐漸成為瓶頸的時代,Ironwood 也大幅提升了計算效率,其每瓦性能是 Trillium 的兩倍,和 2018 年推出的首款 TPU 相比高出近 30 倍。
對于推理的優化代表了 AI 發展歷程中的一個重要轉折點。最近幾年,前沿的 AI 實驗室一直專注在構建參數規模不斷擴大的基礎模型上。谷歌轉向推理優化表明,我們正在進入一個以部署效率和推理能力為核心的新階段。
畢竟對于 AI 參與的業務而言,模型訓練的次數有限,但隨著 AI 技術應用逐漸鋪開,推理操作每天都會發生數十億次。由于模型日趨復雜,這些業務的經濟效益與推理成本緊密相關。
谷歌在過去八年里對于 AI 計算的需求同比增長了 10 倍,總需求量高達驚人的 1 億。如果沒有像 Ironwood 這樣的專用架構,任何摩爾定律的進步都無法滿足這一增長曲線。
尤其值得注意的是,谷歌在發布中提到了對執行復雜推理任務而非簡單模式識別的「思維模型」的關注。這表明,谷歌認為 AI 的未來不僅在于更大的模型,還在于能夠分解問題、進行多步驟推理并模擬類人思維過程的模型。
面向下一代大模型
谷歌將 Ironwood 定位為其最先進 AI 模型的基礎設施,其優化的大模型自然包括自家的 Gemini 2.5,它「原生內置了思維能力」。
昨天,谷歌還發布了 Gemini 2.5 Flash,作為最新旗艦模型的縮小版本,它「可以根據提示的復雜性調整推理深度」,定位于對響應速度敏感的日常應用。
谷歌還展示了其全套多模態生成模型,包括文本轉圖像、文本轉視頻以及新發布的文本轉音樂功能 Lyria。谷歌展示 demo 介紹了如何將這些工具結合使用,為一場音樂會制作完整的宣傳視頻。

Ironwood 只是谷歌更廣泛的 AI 基礎設施戰略的一部分,谷歌還宣布推出 Cloud WAN,這是一項托管式廣域網服務,使企業能夠訪問 Google 的全球規模私有網絡基礎設施。
Google 還在擴展其面向 AI 工作負載的軟件產品,其中包括由 Google DeepMind 開發的機器學習運行時 Pathways,現在它允許客戶在數百個 TPU 上擴展模型服務。
提出 A2A、支持 MCP,構建智能體協作生態
除了硬件之外,谷歌還概述了以多智能體系統為中心的 AI 愿景,發布了一個促進智能體發展的協議 ——Agent-to-Agent(A2A),旨在促進不同 AI 智能體之間的安全、標準化通信。
地址:https://google.github.io/A2A/#/
谷歌認為,2025 年將是 AI 方向轉型之年,生成式 AI 的應用形式會從回答單一問題轉向通過智能體系統來解決復雜問題。
A2A 協議允許跨平臺、跨框架的智能體實現互操作,為它們提供了共同的「語言」和安全的通信渠道。這一協議可視為智能體的網絡層,其目標是簡化復雜工作流程中的智能體協作,使專業 AI 智能體能夠協同完成各種復雜度和時長的任務,從而通過協作提升整體能力。
A2A 的工作原理
谷歌在博客中對 MCP 和 A2A 兩種協議進行了比較。
MCP(模型上下文協議,Model Context Protocol)用于工具和資源管理
通過結構化的輸入 / 輸出將智能體連接到工具、API 接口和資源
Google ADK 支持 MCP 工具,使得各類 MCP 服務器能夠與智能體配合使用
A2A(智能體間協議,Agent2Agent Protocol)用于智能體之間的協作
在不共享內存、資源和工具的情況下,實現智能體之間的動態多模態通信
由社區驅動的開放標準
可使用 Google ADK、LangGraph、Crew.AI 等工具查看示例
總的來說,A2A 與 MCP 是互補的:MCP 可以為智能體提供工具支持,而 A2A 則讓這些裝備了工具的智能體能夠相互對話和協作。
從谷歌公布的合作伙伴陣容來看,A2A 似乎有望獲得類似 MCP 的關注度。該計劃已吸引超過 50 家企業加入首批合作陣營,包括領先科技企業以及全球頂級咨詢和系統集成服務商。
谷歌強調了該協議的開放性,將其作為智能體相互協作的標準方式,不受底層技術框架或服務供應商的限制。谷歌表示,在與合作伙伴設計協議時,堅持了以下五項關鍵原則:
1. 擁抱智能體能力:A2A 專注于使智能體能夠以其自然、非結構化的方式進行協作,即使它們不共享記憶、工具和上下文。我們正在實現真正的多智能體場景,而不將智能體限制為「工具」。
2. 基于現有標準構建:該協議建立在現有流行標準之上,包括 HTTP、SSE、JSON-RPC,這意味著它更容易與企業日常使用的現有 IT 堆棧集成。
3. 默認安全:A2A 設計為支持企業級身份驗證和授權,在發布時與 OpenAPI 的身份驗證方案相當。
4. 支持長時間運行的任務:我們設計 A2A 具有靈活性,支持各種場景,從快速任務到可能需要數小時甚至數天(當人類參與其中時)的深入研究。在整個過程中,A2A 可以向用戶提供實時反饋、通知和狀態更新。
5. 模態無關:智能體世界不僅限于文本,這就是為什么我們設計 A2A 支持各種模態,包括音頻和視頻流。
官方還給出了一個例子,通過 A2A 招聘流程得到顯著簡化。
在 Agentspace 等統一界面中,招聘經理可指派智能體依據職位需求尋找匹配人選,該智能體會與專業領域智能體互動完成候選人尋源工作。用戶還可指示智能體安排面試,并啟用其他專項智能體協助背景調查,從而實現跨系統協作的全流程智能化招聘。
與此同時,谷歌也在擁抱 MCP。就在 OpenAI 宣布采用競爭對手 Anthropic 的模型上下文協議(Model Context Protocol,簡稱 MCP)幾周后,Google 也緊隨其后加入了這一行列。
剛剛,Google DeepMind 首席執行官 Demis Hassabis 在 X 平臺上發文宣布,Google 將在其 Gemini 模型和 SDK 中添加對 MCP 的支持。不過他并未給出具體時間表。
Hassabis 表示:「MCP 是一個優秀的協議,正在迅速成為 AI 智能體時代的開放標準。期待與 MCP 團隊和業界其他伙伴一起推進這項技術的發展。」
自 2024 年 11 月發布以來,MCP 迅速走紅,引發廣泛關注,成為連接語言模型與工具和數據的一種簡單、標準化方式。
MCP 使 AI 模型能夠從企業工具和軟件等數據源獲取數據以完成任務,并訪問內容庫和應用程序開發環境。該協議允許開發者在數據源與 AI 驅動的應用程序(如聊天機器人)之間建立雙向連接。
開發者可以通過 MCP 服務器開放數據接口,并構建 MCP 客戶端(如應用程序和工作流)來連接這些服務器。自從 Anthropic 開源 MCP 以來,多個公司已在其平臺中集成了 MCP 支持。
參考內容:
https://blog.google/products/google-cloud/ironwood-tpu-age-of-inference/
https://venturebeat.com/ai/googles-new-ironwood-chip-is-24x-more-powerful-than-the-worlds-fastest-supercomputer/
https://arstechnica.com/gadgets/2025/04/google-unveils-ironwood-its-most-powerful-ai-processor-yet/
https://virtualizationreview.com/articles/2025/04/09/protocols-for-agentic-ai-googles-new-a2a-joins-viral-mcp.aspx
https://developers.googleblog.com/zh-hans/a2a-a-new-era-of-agent-interoperability/
https://google.github.io/A2A/#/
- 免責聲明
- 本文所包含的觀點僅代表作者個人看法,不代表新火種的觀點。在新火種上獲取的所有信息均不應被視為投資建議。新火種對本文可能提及或鏈接的任何項目不表示認可。 交易和投資涉及高風險,讀者在采取與本文內容相關的任何行動之前,請務必進行充分的盡職調查。最終的決策應該基于您自己的獨立判斷。新火種不對因依賴本文觀點而產生的任何金錢損失負任何責任。