ADVERTISEMENT
NVIDIA 透過 Turing 顯示架構的 RT 與 Tensor 核心,開啟娛樂用顯示卡的新紀元,導入即時光影追蹤與加速深度學習效果,後者在遊戲卡的具體實踐方式為 DLSS。只是目前導入 DXR 和 DLSS 功能的遊戲並不多,加上 RT 與 Tensor 核心佔去的晶片面積,讓製造成本降不下來。
1660 Ti 回歸光柵本色
NVIDIA GeForce RTX 2000 系列顯示卡推出以來,RT 核心可以加速 DXR 運算,DLSS 透過 Tensor 核心能夠以較小的效能開銷獲得反鋸齒效果,但並不是所有遊戲都支援這 2 項先進的技術,更多的是從電腦遊戲開展以來,就使用光柵成像的 3D 遊戲,再加上電子競技蓬勃發展,更在乎的是順暢度,而非駐足欣賞畫面。
或許是聽到玩家的呼應,也或許是原本就在計畫之中,NVIDIA 砍掉 Turing 顯示繪圖架構當中的 RT 核心與 Tensor 核心,推出僅支援傳統光柵成像 GeForce GTX 1660 Ti,未來預計還會推出 GeForce GTX 1660 版本。GeForce GTX 1660 Ti 對應的晶片設計為 TU116-400,其中包含 1536 個 CUDA 核心,相對 Pascal 時代更增進其運算效率,並標配 6GB DDR6 記憶體。
▲GeForce GTX 1660 Ti 與其它顯示卡的規格比較表。(點圖放大)
▲GeForce GTX 1660 Ti/TU116-400 晶片功能方塊圖,內部不包含 RT 核心與 Tensor 核心。
GeForce GTX 1660 Ti 吸引消費者的其中 1 個面向,就是線上電子競技遊戲可達 120FPS,而多種遊戲也可提供相對於 GeForce GTX 1060 6GB 版本 1.5 倍的效能。這其中除了以更多的 CUDA/Stream Processor 單元數量達成,Turing 架構的改進也奉獻不少,諸如共享式記憶體架構,將 Pascal 分離 L1 24KB 快取(供著色器使用)和 96KB 共享記憶體(放置貼圖資料或暫存器資料),整合成單一 96KB,並依據實際需求切割成 32KB+64KB 或是 64KB+32KB。
▲Turing 架構修改 SM 記憶體架構,使其能夠提供 2 倍於 Pascal 架構的整數與半精度運算能力。
▲GeForce GTX 1660 Ti 於多款線上電子競技遊戲,畫面張數表現可達 120FPS 以上。
Turing 架構能夠同時執行整數與浮點數運算,Pascal 架構則是互斥。若以 Shadow of the Tomb Raider「古墓奇兵:暗影」約每 100 個指令當中,整數與浮點數運算約為 38:62,Pascal 就必須依序執行 100 個指令運算,而 Turing 架構則可以同步進行雙方面,減少指令等待執行的時間,提升整體運算效能。
▲Turing 架構可同步進行整數指令與浮點數指令,雙方不再互斥。
整體而言,Turing 架構 IPC 效能對比 Pascal 架構,效能約是 1.5 倍以上,VRMark測試軟體甚至可達 2 倍。將架構更新與製程演進綜合考量、比較,GeForce GTX 1660Ti 相對 GeForce GTX 1060 6GB 的效率約提升 0.4 倍。
▲Turing 架構 IPC 效能約為 Pascal 架構的 1.5 倍以上。
▲Turing 架構的運算效率最高為 Pascal 架構的 1.4 倍。
在軟體部分,GeForce GTX 1660Ti 也為了迎合遊戲線上直播的需求,強調使用內建 NVENC 壓制畫面時,其畫質表現比 OBS x264 Fast 還要好,無論影片流量速率從 3500bps~6000bps 均是如此。
▲透過 OBS 進行線上直播,NVENC 壓制畫面品質比 x264 Fast 為佳。
▲NVIDIA 也向效能比 GeForce GTX 960 低的 NVIDIA 玩家喊話,GeForce GTX 1660 Ti 效能可達 2~3 倍之譜,該是升級的時候了。
(下一頁:Asus ROG STRIX GeForce GTX 1660 Ti)
感謝網友指正