Intel Vision 24:Lunar Lake、Xeon 6處理器以及Gaudi 3加速器推動AI無所不在

Intel Vision 24:Lunar Lake、Xeon 6處理器以及Gaudi 3加速器推動AI無所不在

ADVERTISEMENT

Intel於Vision 24大會帶來Lunar Lake、Xeon 6處理器以及Gaudi 3 AI加速器的最新資訊,為個人與企業用戶帶來更全面的AI運算解決方案。

筆電迎來100 TOPS AI運算效能

Intel Vision 24大會由執行長Pat Gelsinger親自主持,在活動中除了說明許多AI運算產品與解決方案的發展路線規劃,也公開許多產品的規格與上市時程。

在個人電腦部分,繼2023年12月上市的Meteor Lake處理器之後,Intel將在2024年底推出下一代的Lunar Lake處理器,將全機的AI運算效能由前代的34 TOPS一舉提升至超過100 TOPS,並預計在2024年底讓AIPC的出貨量達到4,000萬台。

另一方面Intel也Core Ultra、Core、Atom等處理器與Arc GPU(繪圖處理器)都將針對智慧零售、工業製造和醫療等應用於本季推出新款邊緣運算晶片,並於2024年納入Intel Tiber Edge平台支援。

Intel也將原本代號為Sierra Forest與Granite Rapids的處理器整併為Xeon 6處理器系列,前者將於本季推出,後者則於稍晚上市,2者皆採用Intel 3節點製程。

Sierra Forest搭載E-cores核心,與第2代Xeon處理器相比,電力效率與機架密度分別提高2.4、2.7倍,客戶能夠以接近3比1的比例將舊系統更換成新系統,發揮大幅降低能耗的效果,並強化永續發展目標。

Granite Rapids則搭載P-cores核心,支援MXFP4資料類型的以強化AI運算效能,與使用FP16的資料類型第4代Xeon處理器相比,在執行大型語言模型時能將產生標記(Token)的延遲最多降低6.4倍,並且具備執行運行700億組參數Llama-2模型的能力。

Intel Vision 24:Lunar Lake、Xeon 6處理器以及Gaudi 3加速器推動AI無所不在

▲Intel執行長Pat Gelsinger親自主持Vision 24大會。

AI無所不在由個人端的AIPC、企業端的運算節點與叢集、資料中心的超級叢集共同編織而成。

預定於2024年底推出的Lunar Lake處理器將提高達100 TOPS的全機AI運算效能。

Intel目前以達到500萬台出貨量里程盃,預計在2024年底達到4,000萬台。

Xeon 6處理器可以分為採用E-cores核心的Sierra Forest以及採用P-cores核心的Granite Rapids,2者皆採用Intel 3節點製程。

由第2代Xeon處理器升級至Sierra Forest可以講低約1/3的機架數量,節省100萬瓦的電力消耗並降低27%碳排。

Granite Rapids以MXFP4資料類型進行AI運算效能的效能表現,比使用FP16的資料類型第4代Xeon處理器相比提升約6.4倍。

Pat Gelsinger也在現場展示了Sierra Forest與Granite Rapids晶圓。

強化企業端AI效能

Intel在Vision 24大會正式發表專為高效的大規模AI運算設計的Gaudi 3加速器,由前代的TSMC 7nm節點製程提升為5nm節點製程,其AI專用運算引擎由64組為AI最佳化且可程式化的TPC單元以及8組MME構成,能夠以高效率進行複雜的矩陣運算,且支援FP8、BF16等資料類型。

Gaudi 3搭載容量為96 MB的On-Board SRAM靜態隨機存取記憶體與128 GB的HBMe2高頻寬記憶體(頻寬達3.7 TB/s),能以較少量Gaudi 3滿足處理大型生成式AI資料集所需的記憶體,有助於改善工作效律和資料中心的成本。

在網路功能方面,每組Gaudi 3皆整合24組200 GbE乙太網路端子,實現串接高達上千組運算節點的擴充能力,滿足生成式AI模型的運算需求。

另一方面Intel也與超級乙太網路聯盟(Ultra Ethernet Consortium,UEC)合作,製定開放式乙太網路標準,推出針對AI最佳化的乙太網路解決方案,改善縱向擴展(Scale-Up)、橫向擴展(Scale-Out)的互聯功能,以滿足日益龐大AI模型2k71訓練和推論運算。

Gaudi 3加速器將於2024年第二季向包含Dell、HPE、Lenovo、Super Micro在內的OEM合作夥伴提供通用基板和開放加速器模型(Open Accelerator Module,OAM),並於第三季全面上市。PCIe擴充卡則於第四季上市。

Gaudi 3的AI運算引擎由64組為AI最佳化且可程式化的TPC單元以及8組MME構成,搭載容量為96 MB的On-Board SRAM靜態隨機存取記憶體與128 GB的HBMe2高頻寬記憶體。

與NVIDIA H100相比,Gaudi 3加速在在Llama2 7B和13B參數以及GPT-3 175B參數模型的訓練時間提升50%,在Llama 7B和70B以及Falcon 180B參數模型上推論吞吐量提升50%,推論能源效率提升40%。

Gaudi 3將有OAM運算卡、8連裝通用基板等型式。而PCIe擴充卡版本適合用於微調、推理和檢索增強生成(RAG)等工作,TDP為600W。

Pat Gelsinger也在現場展示8連裝Gaudi 3通用基板。

Gaudi 3規格簡表,其FP8資料類型的運算效能達1835 TFLOPS。

Intel與超級乙太網路聯盟(Ultra Ethernet Consortium,UEC)合作,製定開放式乙太網路標準,推出針對AI最佳化的乙太網路解決方案。

Pat Gelsinger表示:「創新正在以前所未有的速度發展,且都需要晶片的助力,每家公司亦正迅速地轉型為AI公司。英特爾在企業的各層面實現『AI無所不在』,從PC、資料中心到邊緣應用。我們最新的Gaudi、Xeon和Core Ultra平台提供一套全面且彈性的解決方案,以滿足客戶與合作夥伴不斷改變的需求,並充分利用未來的龐大機會將其盈利化。」

國寶大師 李文恩
作者

電腦王特約作者,專門負責硬派內容,從處理器、主機板到開發板、零組件,尖端科技都一手包辦,最近的研究計畫則包括Windows 98復活與AI圖像生成。

使用 Facebook 留言
發表回應
謹慎發言,尊重彼此。按此展開留言規則