高通Snapdragon 處理器一直擁有極其強大的GPU性能,常被調侃為「買GPU送CPU」,但官方對於GPU架構的技術細節一直諱莫如深,每次只說支援XX技術、性能提升XX。到了最新的Snapdragon X Elite/Plus系列處理器上,或許是為了更好地對標Intel、AMD,高通空前大方地公開了Adreno X1 GPU的底層細節,頂級型號為Adreno X1-85。
Adreno X1 GPU細節公開
Adreno X1是專門針對Windows PC設計的,圖形介面完整支援DirectX 12.1(Shader Model 6.7/DirectML)、DirectX 11、Vulkan 1.3、OpenCL 3.0,都有原生驅動支援。
FP32單精度浮點性能最高4.6TFlops(每秒4.6兆次計算),像素填充率最高72Gp/s(每秒720億次)。
如此詳細的架構圖對於高通GPU來說似乎還是第一次,可以看到分為6個著色處理器(SP),整體共計1536個FP32 ALU,可以通俗地表達為1536個核心,最高頻率1.5GHz。
粗暴地按照核心數計算,這相當於GTX 1660 Ti,或者說三個Arc A770,或者說四分之三個RX 7600。
算繪前端模組支援每時脈週期2個三角形和光柵化處理、雙向LRZ(地解析度深度測試)、基於圖像的可變著色率(VSR Tie2)。
還有專門用於分箱(binning)的前端模組,與算繪同步運行。
6個SP對應6個算繪後端,每時鐘週期最多48個像素、96個fragment(用於MSAA抗鋸齒)。
另外還有GMU,也就是GPU管理單元,完整支援虛擬化(最多8個虛擬機器),還有電源管理的作用。
細看SP部分,也就是SIMD著色處理器,屬於核心執行模組,分為兩個uSPTP(微型著色與紋理流水線)。
整個SP,分佈著256個FP32 ALU(單精度浮點算術邏輯單元),支援FP32/16、INT32/16、BF16資料類型,支援DP4ACC指令(四路INT8點積),以及512個FP16 ALU(半精度浮點算術邏輯單元),支援FP16、INT16、BF16資料類型。
此外,還有32個32位EFU(基本功能單元)、384KB GPR(通用暫存器)、指令快取、本地緩衝、載入/儲存單元、紋理流水線和紋理快取、GMEM單元,等等。
GPU內還內建了384KB叢集快取(每兩個SP共享128KB)、1MB一體化二級快取、6MB系統級快取(即三級快取),還有一些其他較小的快取,用於著色器指令、本地紋理資料等。
GMEM是個特殊功能單元,也就是高頻寬的本機GPU影像記憶體,容量3MB,頻寬達2TB/s,與系統記憶體完全非同步。
而且,它不僅僅是快取,還可以全部或部分靈活地用於色彩與景深快取、通用本地記憶體,無論是圖形算繪還是通用計算都可以使用。
它可以讓GPU大大減少對系統記憶體的依賴,降低對延遲和頻寬的需求,還有著超高的性能與能效。
FlexRender彈性算繪技術
FlexRender彈性算繪技術也值得一提,可以由驅動控制,針對每一個不同的表面動態切換不同的算繪模式,提升性能的同時儘可能降低功耗。
具體分為三種模式:
一是Direct Mode,PC標準算繪方式,相容性最好。
二是Binned Mode,將每一幀畫面切分為不同的區塊(Tile),每一個都都會進入GMEM,可儘可能減少資料移動,提高能效。
三是Bined Direct Mode,前述兩種方式的混合。
軟體方面,高通承諾每月升級GPU驅動程式,Adreno控制面板可調節性能和各項功能,而在相容性方面已經是數百款流行的Windows應用程式,已測試的遊戲均可查詢,還有豐富的開發工具。
高通聲稱,Adreno X1對比CoreUltra的Arc內顯,同等功耗下性能領先最多67%,同等行下功耗低最多62%!
對比Ryzen 9 7040系列中的Radeon 780M更是性能、能效都遙遙領先。
在流行的3A遊戲中,官方列出了9款,都基本持平或者優於Intel銳炫內顯,優勢項目包括《地平線 期待黎明》、《火箭聯盟》等。
請注意!留言要自負法律責任,相關案例層出不窮,請慎重發文!