FB 建議貼文

選取貼文複製成功(包含文章連結)!

Google 發表最新 AI 加速器晶片 Ironwood,主打推理效能與節能設計

Google 發表最新 AI 加速器晶片 Ironwood,主打推理效能與節能設計

在本週舉辦的 Cloud Next 大會上,Google 發表了最新一代的 TPU AI 加速器晶片——Ironwood。這款代號「鐵木」的新晶片是 Google 第七代 TPU,也是第一款專為 AI 推理(Inference) 優化的晶片,預計將在今年稍晚提供給 Google Cloud 的企業客戶使用。Ironwood 將提供兩種規模配置:256 顆晶片集群以及9216 顆晶片集群,可依照使用需求彈性擴充。

Google Cloud 副總裁 Amin Vahdat 在官方部落格中表示:「Ironwood 是我們目前為止功能最強大、效能最高,同時也是最節能的 TPU。它是為大規模執行推理與思考型 AI 模型所設計的。」

專為 AI 推理時代打造

Ironwood 的發表正值 AI 加速器晶片競爭日益激烈之際。儘管 NVIDIA 目前仍是市場領先者,但包含 Amazon 和 Microsoft 在內的科技大廠,也積極推進自家晶片。Amazon 旗下有 Trainium、Inferentia 和 Graviton 等處理器,並透過 AWS 提供雲端服務;而 Microsoft 則推出自研 AI 晶片 Cobalt 100,並部署於 Azure 雲端平台。

根據 Google 內部的效能基準測試,Ironwood 的峰值運算效能高達 4614 TFLOP。每顆晶片配備 192GB 專屬記憶體頻寬接近 7.4 Tbps,展現極高的資料吞吐量。

Google 發表最新 AI 加速器晶片 Ironwood,主打推理效能與節能設計

值得一提的是,Ironwood 還搭載了一顆加強型的專屬核心 SparseCore,專門用來處理像是推薦演算法等「高階排序」與「推薦系統」常見的資料結構。Google 表示,TPU 架構的設計目標之一就是盡量減少晶片內部的資料搬移與延遲,進而達成節能目標。

Vahdat 補充,未來 Google 將會把 Ironwood 納入旗下 AI 超級電腦平台,也就是 Google Cloud 中的模組化運算集群。整體來說,Ironwood 象徵著進入 AI 推理時代的一個重要里程碑,不僅效能更強、記憶體容量提升,網路架構與可靠性也同步升級。

KKJ
作者

快科技成立於1998年,是驅動之家旗下科技媒體業務,中國極具影響力的泛科技領域媒體平台之一。

使用 Facebook 留言
發表回應
謹慎發言,尊重彼此。按此展開留言規則