ADVERTISEMENT
AMD在Tech Day 2024結束後,透過Zen 5 Architecture Deep Dive說明會解說Zen 5、RDNA 3.5、XDNA 2等架構的設計特色,筆者將重點整理於下。
1種Zen 5、多種應用
AMD首先在Ryzen 9000系列桌上型處理器以及Ryzen AI 300系列行動版處理器導入Zen 5處理器運算架構,隨後預計於2024年下半推出同樣採用Zen 5架構、代號為Turin的第5代Epyc伺服器處理器,並在投影片中透露也將推出對應的嵌入式處理器。
- 系列文章:
- AMD Tech Day 2024(一):Zen 5、RDNA 3.5、XDNA 2架構齊發,Ryzen 9000系列桌上型處理器架構解析 ,加映Ryzen 9 9950X超頻破世界記錄
- AMD Tech Day 2024(二):Ryzen AI 300系列行動版處理器架構解析,Zen 5、RDNA 3.5、XDNA 2完全體登場
- AMD Tech Day 2024(三):XDNA 2 AI運算架構解析,Block FP16資料類型運算效率倍增
- Zen 5架構詳解(一):桌上型、行動版差異以及Zen 5、Zen 5c差異解說(本文)
- Zen 5架構詳解(二):Zen 5、RDNA 3.5、XDNA 2架構解說
- Zen 5效能實測(一):Ryzen 7 9700X、Ryzen 5 9600X搶先上市,單核心效能增益最高達20%
- Zen 5效能實測(二):Ryzen 9 9950X、Ryzen 9 9900X上市,正16大核怪獸降臨
我們將重點放在家用市場產品,首先看到採用小晶片(Chiplet)設計、代號為Granite Ridge的Ryzen 9000系列桌上型處理器,並從處理器核心開始,由小而大說明其組織架構。
ADVERTISEMENT
Ryzen 9000的每組核心搭配1MB L2快取記憶體,並以最多8組核心構成1組CCX(Core Complexes,核心複合體),共享32 MB L3快取記憶體,然後每組CCX構成1組CCD(Core Chiplet Die,核心裸晶),處理器能夠容納1或2組CCD,而CCD採用TSMC(台積電)4nm節點製程。
舉例來說,6核心的Ryzen 5 9600X只有1組CCX,這組CCX只有6組核心。而16核心的Ryzen 9 9950X的具有2組CCX,每組CCX則有8組核心。
此外,Ryzen 9000還有1組負責記憶體控制、輸出 / 輸入介面以及內建顯示等功能的IOD(I/O Die,I/O裸晶)。值得注意的是AMD先前在Tech Day 2024提到為了簡化研發流程並加速上市日程,因此在Ryzen 9000中沿用了Ryzen 7000世代的IOD,維持TSMC 6nm節點製程,保有具2組運算單元(CUs)的內建顯示晶片以及影片編、解碼加速單元,提供最基本的顯示功能。
ADVERTISEMENT
ADVERTISEMENT
行動版採單一封裝設計
至於代號為Strix Point的Ryzen AI 300系列行動版處理器部分,則採用單一封裝SoC設計,將最多2組CCX與I/O功能置於單一裸晶之內,其中各CCX最多可以容納8組Zen 5或是8組Zen 5c(後詳)核心。
舉例來說,Ryzen AI 9 HX 370的2組CCX分別具有4組Zen 5以及8組Zen 5c核心,總共為12核心組態,而Ryzen AI 9 HX 365則分別具有4組Zen 5以及6組Zen 5c核心,總數為10核心。
Ryzen AI 300的I/O功能最大的改變之處在於強化內建顯示晶片,除了由RDNA 3架構提升為效能與電力效率都更高的RDNA 3.5繪圖架構外,運算單元最大數量也由12組提升至16組,能夠帶來更高的遊戲與3D繪圖效能。另一方面它也將NPU(神經處理器,主要應用於AI運算)的運算架構由XDNA升級為XDNA 2,並將AI引擎模塊(AI Engine Tile)數量由前代的20組擴充為32組,相較於前代產品具有5倍效能與2倍電力效率。
ADVERTISEMENT
不過在新增如此多功能的取捨之下,由處理器提供的PCIe Gen 4通道由原本的20組下調為16組,意味著筆記型電腦產品在安裝固態硬碟之後通道組態將拆為8+8或8+4+4,造成獨立顯示晶片只能使用PCIe Gen 4x8通道,對於高階電競、創作者筆電來說影響較大。
Zen 5、Zen 5c同架構小改款
Zen 5架構的設計目標包括最大化1條與2條執行緒的效能提升,並在AVX-512指令集完整支援512 bit資料路徑(Datapath),同時支援可調整式的FP512、FP256資料路徑,以增進向量運算與AI運算的效能,並能夠選則使用4nm或3nm節點製程,以滿足不同效能、功耗、成本定位的產品需求。
此外AMD也推出Zen 5、Zen 5c等2種衍生核心,Zen 5為正常版核心,而Zen 5c代表「Compact」緊緻版核心。2者都支援相同的指令集以及SMT(Simultaneous Multithreading,多執行緒),並具有一樣的IPC(Instructions per Cycle,每周期指令),主要的差異在於最高時脈以及L3快取記憶體容量不同。
以代號為Strix Point的Ryzen AI 9 HX 370行動版處理器為例,它具有2組CCX,其中1組具有4組Zen 5核心搭配16 MB L3快取記憶體,另1組具有8組Zen 5c核心搭配8 MB L3快取記憶體。
Zen 5核心針對單執行緒效能進行最佳化,具有更高的時脈與容量更大L3快取記憶體,但是相對而言會占據更大的裸晶面積。相較之下,雖然Zen 5c核心的最高時脈比較低,L3快取記憶體容量也比較小,但是能在相同的裸晶面積下提供更多核心數量,並且具有較佳的電力效率,適合在提升系統多工效能的同時控制整體電力消耗。
AMD也表示由於Zen 5、Zen 5c等2種核心支援相同的指令集、具有相同IPC且都支援SMT,因此在資源調度方面會比競爭對手Intel所使用的P-Core、E-Core設計會簡單許多。後者的2種核心支援指令集範圍並不完全相同,各核心的IPC也不相同,且僅P-Core支援SMT,將會因為不同核心之間差異過大,而增加作業系統與處理器內部等軟、硬體工作排程器運作的複雜性,雖然有著可以提高電力效率的優勢,但也有效能比較難達成最佳化的潛在隱憂。
筆者將在下篇文章中繼續深入解說Zen 5處理器、RDNA 3.5繪圖、XDNA 2運算架構的請讀者參考系列文章的連結。
ADVERTISEMENT