2025.01.22 09:00

德國推出全新使用 AMD 架構的水冷式超級電腦 Hunter,邁向 Exascale 時代

ADVERTISEMENT

週四,隨著德國斯圖加特大學(University of Stuttgart)的高效能運算中心(HLRS)宣布其最新的超級電腦 Hunter 建置完成,數百個 AMD APU 正式啟用。 

這套耗資 1,500 萬歐元(約合新台幣 5 億 1,750 萬元)的系統由巴登-符騰堡邦科學、研究和藝術部以及德國聯邦教育和研究部共同出資,將支持各種公共和私人研究工作,從工程和氣象建模到生物醫學研究、材料科學,當然還有人工智慧(AI)。 

Hunter 由惠普企業(Hewlett Packard Enterprise,HPE)所打造,採用 Cray EX4000 平台,並由 AMD Instinct MI300A 加速處理單元(APU)和 Epyc Genoa CPU 組成。 

ADVERTISEMENT

如果這個配置聽起來有點熟悉,那是因為這台機器和 1.74 exaFLOP 的 El Capitan 超級電腦採用相同的架構,只是規模小得多。 

El Capitan 搭載 44,544 個 APU,而 Hunter 僅在 188 個水冷式節點上配備 752 個 APU。 這些加速器每個都擁有 24 個 Zen 4 核心、6 個 CDNA 3 GPU 區塊和 128GB 的同調 HBM3 記憶體。 除了 APU 之外,還配備了額外 512 個 32 核心 Epyc 處理器。 

HLRS 估計 Hunter 的雙精度浮點運算理論峰值效能為 48.1 petaFLOPS,幾乎是其前身 Hawk 的兩倍。 然而,這適用於需要高精度的科學工作負載。 該大學還計劃將該系統應用於各種 AI 應用,包括模型訓練,MI300A 的 BF16 和 FP8 資料類型應可提供 736 petaFLOPS 到 1.47 exaFLOPS 的峰值效能,具體取決於精度。 

ADVERTISEMENT

事實上,在公私合作夥伴關係下,HLRS 表示,德國 AI 新創公司 Seedbox.ai 已經在使用該系統以 24 種歐洲語言訓練開放式大型語言模型(LLM)。 

HLRS 主任麥可‧雷許(Michael Resch)在一份聲明中表示:「AI 的快速發展,以及超級運算領域對永續性的日益重視,意味著高效能運算目前正經歷一個令人興奮的轉型期。」 

談到永續性,Hunter 的一個獨特功能是與 HPE 合作開發的全新「動態功率限制」功能。 此功能旨在透過持續監控應用程式並根據需求調整功率分配來最佳化系統的能源效率。 在 Hawk 超級電腦上的早期測試顯示,此功能可在效能沒有顯著下降的情況下,將功耗降低 20%。

ADVERTISEMENT

從 Hunter 到 Herder 

雖然 48 petaFLOPS 的效能讓 Hunter 無法進入 Top500 的前 10 名,但這不是它主要的目的。 Hunter 是一個過渡系統,主要的目的是幫助研究人員為 APU 和 GPU 編寫和最佳化程式碼,以因應更大規模的超級電腦 Herder 的到來。 

與 Hunter 相同,Herder 將由 HPE 的 Cray 部門製造,並採用基於 GPU 的架構,其雙精度浮點運算效能估計可達「數百 petaFLOPS」。 這兩個系統的總成本為 1.15 億歐元(約合新台幣 39 億 7,750 萬元)。 

預計近期將開始建造 Herder 的外殼和電力設施,並於 2027 年的某個時間點安裝完成的系統。

ADVERTISEMENT

ADVERTISEMENT