ADVERTISEMENT
Intel在資料中心暨AI解決方案媒體說明會中提到多項Xeon 6處理器與Gaudi 3加速器的特色,並帶來實際應用範例。
開放軟、硬體環境強化競爭優勢
Intel亞太暨日本區總經理莊秉翰在說明會開頭便提到執行長Pat Gelsinger退休一事,回顧他致力於讓Intel重新返回技術製造的領導地位(可參考民視新聞片段)。
延伸閱讀:
Intel CEO嗆聲摩爾定律活得很好,18A節點製程Panther Lake處理器下週試產
Intel Vision 24:Intel與合作夥伴共建AI開放平台,搭配RAG技術強化企業私有LLM應用
接著莊秉翰說明,Intel在AI應用領域提供系統先決的完整堆疊方案,透過搭載P-core的Xeon 6處理器和Gaudi 3 AI加速器,以及Intel強大的x86架構與開放生態系,提供企業建構最佳化TCO(總體擁有成本)與最佳電力效率的AI系統。
ADVERTISEMENT
莊秉翰也提到,搭載P-core的Xeon 6處理器與競爭對手AMD EPYC相比,AI推論效能最高相差5.5倍,高效能運算(HPC)則最高相差2.1倍。至於與NVIDIA H100相比,Gaudi 3 AI加速器的LLaMA 2 70B大語言模型推論吞吐量高出競爭對手19%,而成本效益則約為2倍。
ADVERTISEMENT
ADVERTISEMENT
Xeon 6處理器提供更多PCIe通道
Intel業務暨行銷事業群商用業務總監鄭智成也接著說明Xeon 6處理器的特點,在記憶體部分支援12通道、DDR5-6400,較前代8通道、DDR5-5600的整體頻寬高出70%,此外還支援傳輸速度達8800 MT/s的MRDIMM(Multiplexed Rank DIMM),提升資料吞吐量。
Xeon 6處理器也支援CXL 2.0與Type 1、Type 2、Type 3等不同應用型態。舉例來說,透Flat2LM技術能將容量為768 GB的DDR5-6400記憶體組成的DRAM區域,與由768 GB DDR5-6400記憶體搭配768 GB DDR4-3200記憶體組成的Flat2LM區域合併為總量達2304 GB的記憶體池,雖然在執行線上分析處理(Online Analytical Processing,OLAP)工作負載時會損失3%的效能,但是可以大幅縮減1/3記憶體建置成本,整體效益相當可觀。
ADVERTISEMENT
鄭智成在會中強調,Xeon 6處理器的多路併聯透過傳輸速度達24 GT/s的6組UPI 2.0通道交換資料,例如在使用2組具有96條PCIe Gen 5通道的Xeon 6處理器時,系統整體可以使用192條PCIe Gen 5通道。相較之下競爭對手的多路處理器仰賴PCIe交換資料,因此使用2組具有128條PCIe Gen 5通道的處理器時,處理器之間使用64條通道相互溝通,造成系統整體可用PCIe Gen 5通道僅有128條,進而降低安裝擴充卡的能力。
鄭智成也以實際應用情境為例,提到國內某金融企業先前宣佈斥資新台幣3,000萬元建置AI運算伺服器,以滿足AI模型訓練的需求,但是其成本之高,可能不是中小企業可以負擔。
不過若是以現有的開源大型語言模型(LLM)搭配檢索增強生成(Retrieval Augmented Generation,以下簡稱RAG)技術,將企業私有的資訊送入系統進行向量化處理,就能在不重新訓練或是微調模型的情況下,讓模型能夠回答針對企業相關的問題,並透過搭載Xeon 6處理器之伺服器完成AI推論運算,如此一來建置成本可以縮減至新台幣100萬元左右,相當具有優勢。
莊秉翰在會中表示:「隨著AI運算需求日益成長,帶動資料中心和基礎設施大規模轉型,可擴充性、成本、能源效率和安全性成為企業當前關鍵考量因素。因應市場需求攀升,英特爾推出搭載P-core的Xeon 6和Gaudi 3 AI加速器,透過英特爾強大的x86架構與開放生態系,使其能夠支援企業建構具備最佳化總體擁有成本(TCO)及每瓦最佳效能的AI系統,以更佳的效率和成本效益滿足客戶複雜的工作負載。」
ADVERTISEMENT