NVIDIA Shield捨棄掌機大變身,挾Kepler繪圖核心殺進平板市場

ADVERTISEMENT

經典架構配電腦GPU

與去年推出Tegra 4與Tegra 4i一樣,今年推出的Tegra K1也具有2種版本,不過兩者的差異更大,分別是4+1核心、32bit處理器,與2核心、64bit處理器。目前32bit版本Tegra K1已經隨小米平板,與本文主角Shield Tablet出貨,然而64bit版本則尚未正式上市,可能會隨著新款Nexus平板一起問市。

鎖定遊戲影音功能

Sheild系列的定位非常明確,主打的特色就是遊戲功能,Sheild Tablet也不例外。雖然它不像前代產品讓人一看就知道是台掌上型遊戲機,但是將輸入設備改為無線手把的Sheild Tablet,卻也不會因此降低專注遊戲的訴求。

換個角度來看,將裝置改為平板電腦加無線手把的組合,會讓攜帶比較不方便。但是螢幕尺寸卻從5吋提升至8吋,可視面積為前代產品的2.56倍,解析度也從1280 x 720升級為1920 x 1200,加上前置立體聲喇叭,在互有消長的情況下,Sheild Tablet的改變不見得是壞事。

NVIDIA Shield捨棄掌機大變身,挾Kepler繪圖核心殺進平板市場

▲誰也沒想到NVIDIA會把掌上型遊戲主機砍掉重練,變成遊戲取向平板電腦,更大的螢幕與喇叭都有助於提升影音表現。

Tegra K1維持4+1核心設計

Shield Tablet採用的32 bit版本Tegra K1 SoC,在處理器核心部分大體上與Tegra 4相當類似,兩者都是採用ARM Cortex A15架構、4+1核心設計。前後代產品最大的差異是Cortex A15架構的版本從r2p1提升至r3p3,除了修正一些錯誤之外,在r3p0版本中納入的regional clock gating,也可以更精細地控制各邏輯區塊(如暫存器)的時脈,進一步提升電力效率。

自從Tegra 3導入4+1核心的配置之後,這個設計就成為Tegra最大的特色。4+1指的是4個主要核心與1個省電核心(battery saver core)。當裝置處於背景處理郵件或是播放影片等,這類效能需求較低的情境時,系統將關閉主要核心,並使用省電核心負責執行程式。

Tegra K1的多核心管理機制,依然維持使用與前代處理器相同的可變式對稱多工技術(Variable Symmetric Multiprocessing),能夠依處理器負載動態調整運作時脈,或是關閉閒置中的核心,但是開啟中的核心需以相同時脈運作,而且主要核心與省電核心不能同時運作。

NVIDIA Shield捨棄掌機大變身,挾Kepler繪圖核心殺進平板市場

▲Tegra K1具有32bit與64bit等2種版本,64bit版只有2個主要核心,沒有省電核心。兩者的腳位與繪圖核心是一樣的。

繪圖核心跟上電腦腳步

顯示效能是Tegra歷來相當重要的特色之一,到了Tegra K1依舊如此,NVIDIA除了大幅提升顯示核心數量之外,還將電腦版的Kepler架構完整導入行動裝置,除了有助於拉抬效能表現之外,更重要的是能夠帶來電腦與行動裝置API的大一統。

根據NVIDIA所提供的Tegra K1白皮書,Tegra K1採用與GeForce GTX 780M、Quadro K6000等顯示卡相同的Kepler架構,是市面上首款能夠支援目前所有GPU運算API的行動裝置繪圖核心,支援OpenGL 4.4、DirectX 11.2等主流API ,以及CUDA 6等GPGPU的API。

此外,Tegra K1也支援FXAA和TXAA等反鋸齒技術,以及可強化曲面細分(Tessellation)技術的Ploymorph Engine v2.0,讓每個Shader可以讀取超過100萬件紋理資料的Bindless Textures,以及其他多種繪圖技術。

NVIDIA Shield捨棄掌機大變身,挾Kepler繪圖核心殺進平板市場

▲32bit版本Tegra K1的處理器部分幾乎沒有改變,不過繪圖核心部分進步相當大,不但核心數量從72攀升至192,也完全導入電腦版本的Kepler架構。

架構有細微差異

雖然Tegra K1的繪圖核心架構上電腦版Kepler相同,不過在整體配置上還是有些微的差異。Kepler架構顯示卡最基本的運算單元為CUDA核心,串流多工處理器(SMX)由多個CUDA核心加上IO單元、暫存器元件集合而成,1個或多個SMX會配上光柵引擎組合成繪圖處理叢集(GPC)。最後1個或多個GPC再配上ROP、L2快取記憶體、記憶體介面等單元,構成Giga Thread Engine,也就是Kepler架構的主體。

以GeForce GTX 680為例,1536個CUDA核心分散在4個GPC、8個SMX之中,記憶體控制器介面則有4組,具有32組ROP單元,所有核心共用512KB L2快取記憶體。Tegra K1的繪圖核心雖然具有192個CUDA核心,但僅具有1個GPC、1個SMX和1組記憶體控制器介面,總共只有4組ROP單元和128KB L2快取記憶體,架構比桌上型Kepler核心精簡。

除了整體效能會有所落差之外,像是位於SMX中的PolyMorph Engine數量也比較少,會進一步影響Tessellator(曲面細分產生器)的數量,恐將造成特效瓶頸。不過Tegra K1畢竟是行動用SoC,根據NVIDIA官方執行多款熱門手機遊戲的測試,顯示核心的平均功耗約為2W,如此看來這樣的妥協也不是沒有意義。

NVIDIA Shield捨棄掌機大變身,挾Kepler繪圖核心殺進平板市場

▲標準GeForce架構與行動平台架構在Kepler架構會合,兩者還會繼續攜手走向教堂,不對,是攜手往下代Maxwell架構邁進。

NVIDIA Shield捨棄掌機大變身,挾Kepler繪圖核心殺進平板市場

▲是只需原本45%的電力達到相同效能水準。

支援硬體曲面細分

曲面細分最大的特色,就是具備無中生有的能力,可以讓程式在基礎3D模型上,自動產生更多多邊形,讓物體表面更加細緻。相較於傳統繪圖技術,若大量使用多邊形來建構3D模型,不但會增加開發時的工作量,在繪圖時也會拖累效能,曲面細分能夠改善這個問題。

遙想2001年,ATI還存在這個世界上的時候,該公司推出的Readon 8500就具有曲面細分的功能,當時該技術的名稱為TruForm,可惜的是只有少數遊戲支援,而且沒有成為DirectX或是OpenGL等API的標準功能。

時至今日,曲面細分已經被納入DirectX 11與OpenGL 4之中,而Tegra K1是第一款支援曲面細分的行動裝置SoC。相較於使用OpenGL ES2.0進行繪圖,可以省下超過50倍的預先繪製的多邊形,就能達到與使用曲面細分繪圖品質和細節,有助於提供更細膩的遊戲畫面。

NVIDIA Shield捨棄掌機大變身,挾Kepler繪圖核心殺進平板市場

▲Tegra K1的繪圖核心採用Kepler架構,基本上SMX長得和電腦版Kepler相同,但整體組成有些差異。

全域照明

與全域照明相對的繪圖技術為區域照明(Local Illumination),兩者最大的差異在於全域照明除了會計算直接光源外,還會計算光線碰觸到物體後所產生的漸接光源。全域照明可以處理包含反射、折射以及陰影等不同漸接光源現象,並模擬光線在場景中的多次反射、折射,或是被陰影吸收的狀況,帶來更加逼真的光影表現。

由全域照明對於運算量的需求更大,因此往往會對效能造成衝擊,而Compute Shader則是對繪圖核心進行最佳化的平行運算技術,與CUDA、DirectCompute,以及 OpenCL等GPGPU的應用類似,可以在節省電量與資料傳輸頻寬的前題下,進行諸如全域照明等運算的運用。

NVIDIA Shield捨棄掌機大變身,挾Kepler繪圖核心殺進平板市場

▲全域照明會透過更加複雜的方式,計算光線與場景互動的狀況,能夠更加逼真地模擬各種反射、折射與陰影的現象。

更多繪圖技術進入行動裝置

除了曲面細分外,Kepler也為行動裝置領域帶來更多繪圖技術,諸如Bindless Textures、Deferred Rendering以及Compute Shader等等。Bindless Textures是Kepler架構的重點功能之一,以往DirectX 11顯示卡在處理材質時,需要先在Binding Table配置對應的儲存空間,在DirectX 11規範中每個Shader最多只能存取128個材質數據。

透過Bindless Textures技術,能夠解除原本材質需先配置的綁定限制,讓Shader能夠存取材質的數據量暴增到100萬個,除了可以提高材質數量,還能減少CPU使用率。

Deferred Rendering會將繪圖流程分為2個步驟,在第一階段中,系統只會將物體各平面的位置、法線向量運算完畢,並存入幾何緩衝區(G-buffer)中,接下來在第二步驟中,才會開始計算直接、漸接光源,提高光源運算效率。Compute Shader則是在OpenGL 4.3才納入標準的規範,可以用來進行全域照明(Global Illumination)等繪圖技巧的運算,帶來更加逼真的光影表現。

NVIDIA Shield捨棄掌機大變身,挾Kepler繪圖核心殺進平板市場

▲曲面細分可以提供更加複雜的多邊形幾何運算,帶來更逼真的視覺效果。Tegra K1是第一款支援硬體曲面細分技術的行動裝置SoC。

跑分效能傲視群雄

附表中的各項跑分測試,皆是在預設狀態下進行3次測試並取平均值。整個測試跑下來,可以發現Tegra K1的成積幾乎都是直接排在該測試軟體內建排行榜的第一名,不負筆者對其效能表現的期望。

需要一提的是,在3DMark測試部分,由於Ice Storm與Ice Storm Extreme會受到Android裝置的Vsync限制。當實際fps效能超過60幀時,超出的部分即無法測得(fps會強制鎖定在60幀),3DMark的測試結果僅會顯示Maxed Out,因此這邊只列入Ice Storm Unlimited的成績。

在各測試項目中,Tegra K1處理器效能普遍僅小幅領先競爭對手,與前代產品Tegra 4的差異也不大。最亮眼的部分還是在於繪圖效能的成長,與Tegra 4相比成長幅度近1倍,也於其他產品保持較大的效能領先。

NVIDIA Shield捨棄掌機大變身,挾Kepler繪圖核心殺進平板市場

▲Tegra K1的Kelper顯示核心,比眾多採用Adreno 330顯示核心產品有更好的表現。(Shield Tablet、Portable以外數據為測試軟體內建資料)

NVIDIA Shield捨棄掌機大變身,挾Kepler繪圖核心殺進平板市場

▲能衝上3000分的3款產品都採用Tegra K1,Shield Tablet的成績幾乎是上代產品的3倍。(Shield Tablet、Portable以外數據為測試軟體內建資料)

 

(下頁有更多結構設計介紹)

國寶大師 李文恩
作者

電腦王特約作者,專門負責硬派內容,從處理器、主機板到開發板、零組件,尖端科技都一手包辦,最近的研究計畫則包括Windows 98復活與AI圖像生成。

使用 Facebook 留言
發表回應
謹慎發言,尊重彼此。按此展開留言規則