CES 2025 - NVIDIA編輯日(下):RTX 50系列顯示卡獨有DLSS 4多重畫格生成超級效能禁藥與Reflex低延遲技術

CES 2025 - NVIDIA編輯日(下):RTX 50系列顯示卡獨有DLSS 4多重畫格生成超級效能禁藥與Reflex低延遲技術

ADVERTISEMENT

NVIDIA推出DLSS 4升頻與Reflex低延遲等強化遊戲體驗的技術,其中還包括RTX 50系列顯示卡獨享、能夠讓遊戲FPS效能衝到8倍的多畫格補幀效能禁藥。

DLSS 4節省15/16繪圖負載

NVIDIA應用深度學習研究副總裁(VP of Applied Deep Learning Research)Bryan Catanzaro分析遊戲體驗受3大即時繪圖因素影響,分別為影像畫質、流暢度、靈敏度,若將這3個因素轉換為量化數據,就是解析度、FPS、操作延遲。然而需要改善這3種因素都會導致運算負載增加,在不提高系統效能的前提下,只能在3者間互相取捨,或是升級更高階或更大量的顯示卡,以滿足運算需求。

而NVIDIA也提供另類的解決方案,就是透過DLSS、Relfex等技術,以AI協助改善遊戲體驗。

延伸閱讀:
CES2025:黃仁勳手持「矽盾」演講,發表Blackwell家族顯示卡、顯示晶片,RTX 5090 71990元月底上市
CES2025:NVIDIA GeForce RTX 5090 效能怪獸!雙穿透散熱設計、電路板解密
CES 2025 - NVIDIA編輯日(上):RTX 50系列顯示卡與Blackwell架構特色解說
CES 2025 - NVIDIA編輯日(下):RTX 50系列顯示卡獨有DLSS 4多重畫格生成功能與Reflex低延遲技術(本文)

NVIDIA推出的DLSS主要可以分為3大類功能,分別為降低遊戲繪製解析度並透過AI升頻的超解析度(Super Resolution)、透過AI強化光線追蹤繪圖的光線重建(Ray Reconstruction),以及透過AI產生額外畫格的畫格生成(Frame Generation)。前2者皆能降低繪圖的實際運算需求,具有降低延遲與提高FPS效能的雙重功效,畫格生成不會降低繪圖運算量且需等待短暫AI運算的間格,所以會造成延遲微幅提高,但仍可提升FPS效能。

(強烈建議讀者點擊上方3項技術之超連結,複習一下它們的原理。)

新推出的DLSS 4具有2大改變,首先它將超解析度、光線重建、畫格生成等3種AI功能使用的模型架構,由原先的卷積神經網路模型(Convolutional neural network,CNN)改為Transformer模型,有助於提升時域穩定性(Temporal Stability),發揮降低鬼影、提高動態細節等效果。

所有的GeForce RTX系列顯示卡(包含RTX 20 / 30 / 40 / 50)都可以透過更新驅動程式的方式取得DLSS 4的Transformer模型功能。而NVIDIA也表示,如同過去6年間CNN模型能夠透過升級模型改善DLSS的圖像品質,Transformer模型也具有相當的發展潛力,並且同樣可以藉由軟體升級的方式提升品質。

DLSS 4的另一個重大更新是支援多重畫格生成(Multi Frame Generation),最多可以參考單一繪製畫格以產生3個生成畫格。然而這個功能需要在系統繪製1個畫格之後,執行5組AI推論運算以產生額外的3個生成畫格,AI運算的負載較先前的3組推論高出許多,因此限定只能在RTX 50系列顯示卡使用。

NVIDIA App中提供DLSS覆寫設定功能(DLSS Overrides),如果原本遊戲支援DLSS的超解析度、光線重建、畫格生成等功能,則可透過覆寫設定強制切換至Transformer模型,以獲得更細緻的升頻效果,或是將超解析度功能強制切換為DLAA反鋸齒功能或超高效能模式(Ultra Performance)。此外如果原本遊戲支援DLSS畫格生成功能,還強制開啟多重畫格生成功能(仍只支援RTX 50系列顯示卡)。

遊戲體驗受影像畫質、流暢度、靈敏度等因素影響,若只有單一顯示卡就需要在不同因素之間取捨。

如果使用10張顯示卡或許能滿足3個因素,但卻不切實際。NVIDIA則提出以AI達成相近效果的解決方案。

DLSS 4的2大改變為改用Transformer模型與新增多重畫格生成功能。其中Transformer模型具有降低鬼影、提高動態細節等效果。

NVIDIA官方提供的CNN與Transformer超解析度模型對照影片。

影片中的主角會晃動身體,而使用Transformer模型具有較佳的圖像品質,背包的紋理仍清晰可見。

光線重建功能改用Transformer模型後有具有較佳畫質。

CNN模型的鐵絲網充滿鋸齒,後方物件比較模糊。Transformer模型則沒有此為問題。

過去使用DLSS 3的會執行超解析度與光線重建、畫格生成、光學流加速器等3套AI推論運算。

DLSS 4的多重畫格生成則會執行超解析度與光線重建、畫格生成、3組AI光學流,總共5套AI推論運算。

但是DLSS 4只需執行圖中灰色的實際繪圖,透過升頻方式放大至4倍解析度,並透過多重畫格生成產生3個額外畫格。等於將實際繪圖負載降低只1/16,其於15/16的畫面資訊都是由AI生成。

NVIDIA官方提供的DLSS 4效能增益圖表,最高可帶來8.2倍的增益。

4種不同情況的FPS與延遲對照。左起為關閉DLSS,開啟DLSS 2(超解析度)因降低實際繪圖負載,對FPS與延遲都有幫助。DLSS 3.5加入畫格生成,可以提升FPS,但延遲持平。DLSS 4則透過多重畫格生成進一步提升FPS。

DLSS 4功能相容一覽。畫格生成需使用RTX 40 / 50系列顯示卡,而多重畫格生成需RTX 50。

AI協助降低遊戲延遲

NVIDIA先前推出的Reflex低延遲技術透過取消繪圖佇列的方式降低遊戲的操作延遲,進而提升玩家的競技優勢。

Reflex 2則是進一步使用AI圖像生成的局部重繪(Inpaint)方式產生2個畫格之間的差異,以降低繪製時間(Frame Time),有助於更快將玩家操作後的畫面送至螢幕,降低延遲並提高遊戲操作的靈敏度。

以射擊遊戲為例,當遊戲的FPS已經很高的時候,玩家移動滑鼠並移動視角時,每個畫格的差異就會很小,這時候與其重新繪製整張圖片,還不如參考前一張畫格與視角變動等資訊,然後以局部重繪方式產生下一張畫格,如此一來就能省去很多運算時間,發揮進一步降低延遲的效果。

這是什麼諾貝爾獎等級的創意!

目前已有120款遊戲支援Reflex低延遲技術。

傳統繪圖機制會在CPU(處理器)完成運算並產生繪圖需求後,將需求送進佇列,等待GPU(繪圖處理器)進行繪製。

Reflex則是捨棄繪圖佇列,繪圖需求一旦產生就就直接送進GPU。

Reflex 2維持這樣的基本機制,並新增透過AI圖像生成的方式縮短部分畫格的繪製時間,以降低遊戲延遲。請注意GPU欄的3張圖,中間圖的右半部為滑鼠移動後需要重新繪製的區域,下方圖則是透過AI圖像生成補上空缺,有助於縮短繪圖時間,並降低操作與新圖像傳送至螢幕的延遲。

在遊戲FPS很高的情況,每個畫面的差異就會相對比較小。圖中左側白色標示的部分(畫面左上與左下,槍枝右上部)則為需要透過AI圖像生成「填空」的部分。

關於Blackwell 架構與RTX 50系列的初步特色功能介紹先到此告一段落,筆者也會在近期持續製作,GeForce RTX 5090效能測試與更多技術解說的專題報導,請讀者保持關注。

國寶大師 李文恩
作者

電腦王特約作者,專門負責硬派內容,從處理器、主機板到開發板、零組件,尖端科技都一手包辦,最近的研究計畫則包括Windows 98復活與AI圖像生成。

使用 Facebook 留言
發表回應
謹慎發言,尊重彼此。按此展開留言規則