
ADVERTISEMENT
AMD在RDNA 4繪圖架構改善AI運算加速器,並新增支援更多資料類型,以及透過軟體最佳化提升運算效能,也帶來以機器學習為基礎的FSR 4升頻技術。
回到系列文章目錄:AMD發表RDNA 4繪圖架構與Radeon RX 9070系列顯示卡,支援全新ML加持FSR 4升頻功能
AI效能最高翻8倍
筆者在先前《AMD RDNA 4繪圖架構說明》一文中提到RDNA 4架構的硬體設計改進,其中的第3代AI加速器(矩陣運算加速器)同樣支援Wave Matrix Multiply Accumulate指令集,並新增FP8與BF8(E4M3、E5M2)等資料類型,以及新增支援結構稀疏性(Structured Sparsity,可提升1倍峰值效能)。
與前代RDNA 3相比,RDNA 4的每組運算單元(CU)在FP64、FP32資料類型的基本運算效能相同,但在FP16有2倍效能表現,INT8、INT4則達到4倍,若再搭配結構稀疏性則可分別提高到4倍、8倍,提升相當顯著。
另一方面AMD也持續改善AI運算環境的框架,透過對模型的最佳化來提高整體運算效能,並簡化部署模型的工作流程。
▲在進行Stable Diffusion XL、Stable Diffusion 3、Flash Stable Diffusion 3、FLUX.1等模型的AI圖像生成運算時,RDNA 4架構能透過Microsoft Olive框架與最佳化的ONNX框架加速運算效能。
改善FSR 4與AFMF 2.1效能禁藥畫質
AMD也在FSR 4(FidelityFX Super Resolution 4)升頻功能導入機器學習(Machine Learning,AI運算的一個分枝)類型的模型,能夠在提升遊戲FPS效能的同時,改善升頻後的畫質表現。不過AMD資深副總裁暨GPU技術與工程研發王啟尚在Radeon RX 9000系列顯示卡發表會說明,FSR 4的模型採用FP8資料類型,然而RDNA 3 / 3.5以及先前的顯示架構並不支援FP8,代表只有採用RDNA 4架構的有Radeon 9000系列顯示卡才能使用這項功能。
值得注意的是AMD在FSR 3.1導入可升級式API,能夠降低已支援FSR 3.1的遊戲可以升級至FSR 4的開發門檻,讀者可以參考AMD提供的FSR 4遊戲相容清單,並在AMD Software Adrenalin Edition驅動程式中開啟FSR 4升頻功能。
另一方面,AMD也推出強化畫質的AFMF 2.1畫格生成(AMD Fluid Motion Frames)功能,它以先前推出的AFMF 2為基礎,能在所有使用DirectX 11、DirectX 12、OpenGL、Vulkan等繪圖API的遊戲強制開啟畫格生成,提升遊戲的FPS效能表現。
另一方面,AMD也在AMD Software中透過HYPR-RX整合多種改善遊戲效能與延遲的技術,讓玩家只需開啟HYPR-RX,就能自動套用多種技術為遊戲效能最佳化,簡化設定的操作流程。
AMD的FSR 4與競爭對手NVIDIA的DLSS 4相比,缺少了最多能讓FPS效能提升4倍的多重畫格生成功能,但卻能以同時開啟FSR與AFMF等2種畫格生成的方式達到接近的成效,有興趣的讀者可以參考筆者先前所寫的《AMD AFMF 2畫格生成效能禁藥再升級,疊加FSR 3猛上加猛效能實測!》一文,看看疊加2種效能禁藥的效果如何。
請注意!留言要自負法律責任,相關案例層出不窮,請慎重發文!