AMD RDNA 4繪圖架構說明:2倍光柵繪圖、2.5倍光追、4倍AI的效能躍進之旅

AMD RDNA 4繪圖架構說明:2倍光柵繪圖、2.5倍光追、4倍AI的效能躍進之旅

ADVERTISEMENT

AMD推出的RDNA 4繪圖架構在光柵化、光線追蹤繪圖以及AI運算的效能表現較前代產品都有長足進展,讓我們一起瞭解其中的改進之處。

回到系列文章目錄:AMD發表RDNA 4繪圖架構與Radeon RX 9070系列顯示卡,支援全新ML加持FSR 4升頻功能

較RDNA 2提升2~4倍

RDNA 4繪圖架構在基礎的運算單元(Compute Unit,以下簡稱CU)、光線追蹤加速器、AI加速器等元件都有所改善,能夠帶來顯著的效能提升,筆者將AMD所舉行的說明會內容與簡報整理如下,我們先看到RDNA 4架構的特色說明。

RDNA 4的特色包括針對高階遊戲應用最佳化、強化光柵化繪圖(Rasterization,即傳統繪圖)與運算效率、改善光線追蹤效能、支援高效能機器學習(Machine Learning,以下簡稱ML)、強化記憶體頻寬,改進多媒體功能。RDNA 4架構的光柵化繪圖光線追蹤繪圖、AI運算的效能表現大約可提升至RDNA 2的2、2.5、4倍。

RDNA 4架構提供許多4K遊戲應用需要的改進,包括第3代光線追蹤單元、矩陣加速器(能提高AI與ML運算效能)、最佳化快取記憶體系統(2MB整合CU快取、8MB L2快取、64MB Infinity Cache)、使用高速GDDR6顯示記憶體、強化的指令處理器、2組媒體引擎、支援DisplayPort 2.1a與HDMI 2.1b的顯示引擎,並使用先進的TSMC(台積電)4nm節點製程。

RDNA 4的媒體引擎能夠提升25% H.264格式在低流量或是11% HEVC(H.265)格式的畫質表現,並改善AV1格式的B Frame(雙向預測畫格)效率,並對FFMAPEG、OBS、Handbreak、VLC等轉檔、直播、播放軟體最佳化。

RDNA 4的媒體引擎強化FreeSync電力最佳化,並支援硬體翻轉佇列(Flip Queue,可節省影片播放時的處理器耗電)、Radeon Image Sharpening 2影像銳利化等功能。

細看各種單元改進

在瞭解RDNA 4架構的特色之後,我們接著看看各種運算單元是如何改進並提升整體效能表現。

其中比較值得注意的部分是全新的定向包圍盒(Oriented Bounding Box),它透過旋轉包圍盒方向的方式,達成以較小包圍盒覆蓋物件,能夠降低整體運算的負載,達到提升光線追縱效能的效果。

在RDNA 4的運算引擎部分,純量運算單元新增支援FP32資料類型,並整合2組SIMD32向量單元、強化光線追蹤與矩形運算效能、改進排程器與指令預取能力。

光線追蹤加速器部分,RDNA 4的單元支援每包圍合8組光線或每三角型2組光線偵測,具獨立硬體光線追蹤個體轉換(Instance Transform)並改善BVH(Bounding Volume Hierarchy)資料結構、支援BVH8光線遍歷(Ray Traversal),以提高運算效能並降低記憶體佔用量。

新增支援定向包圍盒機制能夠旋轉偵測光線是否與物件接處的「包圍盒」,讓原本需要使用尺寸相對大了許多的包圍盒(右上圖),改為使用尺寸較小但可旋轉的包圍盒來覆蓋需要偵測的物件,達到大約提升10%光線遍歷效能的成果。

RDNA 4架構進一步改善亂序記憶體存取的能力,並支援來自不同渲染器(Shaber)的存取需求,進一步降低記憶體子系統統的延持,對光線追蹤繪圖的效能表現有關鍵性的幫助。

將上述多樣改進疊加起來之漏,RDNA 4每組CU的光線追蹤效能能夠提升至RDNA 3的2倍。

過去RDNA 3暫存器的設計概念為設想最差的定址狀況,可能會造成暫存器空間的浪費(右側上圖)。而RDNA 4則可動態排列資料(右側下圖,注意頂部的動態排列區塊),有助於提高暫存器使用率,發揮降低記憶體延遲並大幅提升渲染器效率等功用。

AMD也在簡報中說明,光線追蹤的方式為計算視線(Visibility)之反射、漫射路境並反推光線照射所走過的路徑。而路徑追蹤(Path Tracing,也稱為全光線追蹤)的運作原理則是直接計算大量光線照射路徑,可以提供逼真的光照效果,但運算負載相當吃重。

AMD將與Microsoft合作開發用於路徑追蹤的神經超取樣以及降噪規範,推動這項技術發展。

▲AMD透過影片展示透過路徑追蹤、ReStir快速光線運算、神經超取樣與降噪等技術達到即時渲染的成果。

筆者將持續在下篇文章中說明RDNA 4架構的AI運算細節以及FSR 4升頻等功能,也會待時機成熟帶來Radeon RX 9070 XT與Radeon RX 9070顯示卡的效能實測專題,請讀者持續保持持續關注我們的報導。

點我回到系列文章目錄

國寶大師 李文恩
作者

電腦王特約作者,專門負責硬派內容,從處理器、主機板到開發板、零組件,尖端科技都一手包辦,最近的研究計畫則包括Windows 98復活與AI圖像生成。

使用 Facebook 留言
發表回應
謹慎發言,尊重彼此。按此展開留言規則