2024.05.15 11:00

Intel的超級電腦Aurora打破每秒千兆次運算的exaFLOPS大關,但可能還是無法在超級電腦排行榜奪冠

ADVERTISEMENT

美國阿貢國家實驗室 (ANL) 的 Aurora 超級電腦已正式突破 ExaFLOPS(每秒千兆次運算) 大關,但再次未能撼動橡樹嶺國家實驗室 (ORNL) 的 Frontier 系統,無法在今年春季 Top500 超級電腦排行榜上奪冠。 

勞倫斯利弗莫爾國家實驗室 (LLNL) 的 El Capitan 超級電腦預計最早將在今年秋季登上 Top500 榜單,這似乎意味著備受期待但延遲已久的 Aurora 系統可能永遠無法稱霸這個排行。 

Aurora 配備 21,248 顆英特爾使用高頻寬記憶體 (HBM) 的 Xeon Max 處理器和 63,744 顆 GPU Max 加速器,在去年交付給美國能源部 (DoE) 的阿貢國家實驗室時,人們預期這將成為美國有史以來最強大的超級計電腦。 

ADVERTISEMENT

不過,在去年11月的Top500排行榜出爐時,阿貢實驗室僅讓 Linpack 程式運行在系統的一半左右的規模。即使性能只發揮了一半,這台機器還是展現了驚人的每秒585兆次(585petaFLOPS)的雙精度性能。而在本季的排行榜上,我們開始看到這個系統真正的實力。

這次看起來是使用全部的性能運轉,阿貢實驗室這次取得超過一個千兆次的性能(1 exaFLOPS0)的性能,使其正式成為第二個登上 Top500 公開超級電腦榜單的 ExaFLOPS 等級的系統。 

當然,眾所周知,在 ExaFLOPS(每科千兆次) 運算方面,中國在秘密運行著數個這樣等級或更高的超級電腦,這是大家都知道的事實。隨著中美貿易關係繼續惡化,尤其是在高性能計算、人工智慧和半導體製造等領域,中國短期內恐怕不會揭露其 ExaFLOPS 系統的資訊。 

ADVERTISEMENT

英特爾的 Aurora 系統明顯落後於其他系統的方面之一是功耗。儘管使用了更現代的架構,但該機器遠非最節能的機器。突破 ExaFLOPS 大關需要高達 38.6 兆瓦的電力。作為參考,Frontier 只需 22.7 兆瓦的電力就實現了 1.2 exaFLOPS 的性能。 

儘管仍然無法與 Frontier 匹敵,但阿貢實驗室似乎還有很大的改進空間。目前,該實驗室僅實現了這台機器 1.98 exaFLOPS 理論峰值性能的一半多一點。 

經過發布後我們得知,Aurora達到1.01 exaFLOPS的分數是在機器運作了87%的情況下實現的。

ADVERTISEMENT

即使 Aurora 最終能夠超越 Frontier,也還有一個更大、更強大的系統即將到來。LLNL 的 El Capitan 超級電腦將是首批使用 AMD 的 MI300A APU 的系統之一。 

我們在 AMD 去年 12 月的發表會上詳細介紹了這些晶片,簡而言之,它們將三個 Zen 4 運算晶片(總共 24 個核心)與六個 CDNA 3 GPU 晶片整合到一個插槽中。GPU和CPU作為一個單元共享高達128GB的高速HBM3記憶體。 

El Capitan 預計峰值性能為 2.3 exaFLOPS,比 Aurora 高出近 400 petaFLOPS(請記住,這是理論性能,並非實際性能),使其在理論上比日本超級電腦「Fugaku」快近一倍。 

ADVERTISEMENT

當然,正如 Aurora 的 Linpack 基準測試所表明的那樣,在如此大的規模上真正釋放全部運算能力是相當棘手的。所以,也許Aurora 有機會在最後關頭奪冠。 

Alps到來,Sierra從前10名滑落 

雖然榜單上最強大的 10 個系統與去年 11 月相比基本沒有變化,其中 Eagle、Fugaku和 LUMI 分別佔據第三、第四和第五名,但我們發現瑞士的Alps超級電腦取代了Leonardo,佔據了第六名。 

Alps以 270 petaFLOPS 的 Linpack 分數成為 Top500 榜單上使用 Nvidia Grace-Hopper 超級晶片的最強系統。Nvidia 的 GH200 在 2022 年的 GTC 大會上亮相,並於今年早些時候開始交給客戶,它結合一個 72 核 Arm 處理器和 480GB 的 LPDDR5x 記憶體與一個 H100 GPU 和 96GB 到 144GB 的 HBM3 或 HBM3e記憶體。 

在Alps之後,Leonardo系統仍表現強勁。然而,位於第八名的西班牙 MareNostrum 5 ACC 超級電腦超越了英勇的 Summit 超級電腦,自去年秋天以來 Linpack 性能測試分數增加了 38 petaFLOPS,達到 175 petaFLOPS。但值得注意的是,因為儘管分數更高,這台機器的規模似乎比去年略有縮小,這次記錄的核心數量減少了 17,920 個。 

第九和第十名分別是橡樹嶺國家實驗室的元老級超級電腦 Summit 和NVIDIA的 Eos 超級電腦(注意,不是那個配備 10,000 顆 GPU 的版本,那是一台不同的機器)。 

隨著Alps系統的加入,勞倫斯利弗莫爾國家實驗室 (LLNL) 的Sierra超級電腦正式跌出前十名。這台由 IBM 的 Power 9 處理器和NVIDIA現在已略顯老舊的 V100 GPU 驅動的超級電腦,在過去六年裡一直保持在前十名的位置。

未來一年精彩不斷 

儘管 El Capitan 可能會成為 2024 年的性能霸主,但隨著預計今年晚些時候上線的幾個備受矚目的超級電腦,Top500 榜單可能會再次迎來洗牌。 

其中規模最大的將是歐洲首台 ExaFLOPS 超級電腦 Jupiter 系統。目前尚不清楚該機器是否能趕上 11 月份的超級電腦大會(Supercomputing),但據報導,憑藉由 SiPearl 基於 Arm 架構的 Rhea 處理器支援的 24,000 顆 GH200 超級晶片,Jupiter 將在實際的 HPC 工作負載中超過 1 exaFLOPS 的性能。 

然後是英國的 Dawn 和 Isambard-AI 系統。據報導,Dawn 採用與 Aurora 相似的設計,建成後將擁有超過 10,000 顆 GPU,理論峰值性能達到 532 petaFLOPS。與此同時,布里斯托大學的 Isambard-AI 預計峰值 FP64 性能將超過 200 petaFLOPS。 

我們也很有可能看到更多基於雲端的系統,例如微軟的 Eagle,登上 Top500 榜單。隨著 GPU 運算集群、雲端服務商和超大規模廠商部署數萬顆用於人工智慧的 GPU(Meta 今年計畫部署 350,000 顆 H100),毫無疑問,這些系統一定都有人至少會運行一次 Linpack基準測試。

 

資料來源:

ADVERTISEMENT