NVIDIA於GTC 22秋季場發表RTX 40系列顯示卡與多款運算平台與雲端服務

NVIDIA在GTC 2022技術大會秋季場發表RTX 40系列顯示卡，以及IGX、Drive Thor等運算平台與Omniverse Cloud雲端服務，強化AI與元宇宙等多元應用。

RTX4090 10月12日登場

在GTC開幕演說一開場，NVIDIA創辦人暨執行長黃仁勳就端出採用Ada Lovelace架構的RTX 40系列顯示卡，首波推出的產品包括GeForce RTX 4090，以及GeForce RTX 4080 16GB、GeForce RTX 4080 12GB。

GeForce RTX 4090將於2022年10月12日搶先開賣，官方定價為美金1,599元，它具有16384組CUDA核心，加速核心時脈可達2.52GHz，搭載寬度為384bit的GDDR6X記憶體，容量高達24GB。

GeForce RTX 4080要等到11月才會登場，2者都是採用GDDR6X記憶體，其中16GB版本的記憶體通道寬度為256bit，並具有9728組CUDA核心，加速核心時脈可達2.51GHz。12GB版本的通道寬度僅有192bit，CUDA核心數也縮減約21%，僅有7680組，加速核心時脈為略高的2.61GHz。

這個操作相當了不起，若是其他廠商可能會將「GeForce RTX 4080 12GB」命名為「GeForce RTX 4070」，但在黃老闆妙手刀法之下，頓時讓產品的質感更顯尊爵不凡。另一方面，演說中的投影片也表示GeForce RTX 3080、3070、3060還會繼續販售，或許也暗示了這些產品持續發揮保值的特性。

RTX 40系列將導入渲染器執行重新排序（Shader Execution Reordering，SER）、DLSS 3等新技術，分別能提升25%與4倍遊戲FPS效能。更多技術細節筆者將於日後撰文解析。

黃仁勳還是有為玩家帶來好消息，那就是NVIDIA將會推出免費的《傳送門》RTX版，擁有正版《傳送門》的玩家將可於11月下載免費的DLC，以全新的視覺體驗重溫這款經典遊戲。

▲ 黃仁勳拿出GeForce RTX 4090展示。不知道這位是否為數位影像呢？

▲ GeForce RTX 4090能提供2~4倍於GeForce RTX 3080 Ti的遊戲效能，定價為美金1,599元。

▲ 16GB與12GB的GeForce RTX 4080定價分別為美金1,199元、899元。

▲ 台灣官方網站曾標示2款GeForce RTX 4080的價格分別為新台幣42,990元、32,990元，後來價格資訊已被撤下。

▲ 從規格簡表可以看出3張顯示卡除了記憶體容量不同外，CUDA核心數量的差異也很大。

▲ GeForce RTX 3080、3070、3060等產品還會繼續在市場上存活，且價格與發表時維持相同。

▲ Ada Lovelace架構在渲染器、光線追蹤單元、Tensor核心都有大幅度改進。

▲ 渲染器執行重新排序能夠提升2~3倍光線追蹤運算效能，對遊戲的整體效能有25%的提升效果。

▲ DLSS 3則採用更多預測方式，來建構更完善的高畫質遊戲畫面，同時還能提升遊戲FPS效能最高達4倍之譜。

▲ NVIDIA將推出免費的《傳送門》RTX版，擁有正版《傳送門》的玩家將可於11月免費下載DLC。

H100帶來革命性效能提升

NVIDIA宣佈採用Hooper架構的H100 GPU將進入全面生產階段，並開始於LaunchPad提供H100的存取，用戶能在建置運算叢集之前先體驗與評估H100的效能表現。另外由合作夥伴推出搭載H100的系統也將於2022年10月開始出貨，NVIDIA也將依序推出PCIe介面卡、DGX、HGX等超級電腦產品。

根據NVIDIA官方提供的效能測試數據，64台HGX H100就能帶來等同於320台前代HGX A100的AI訓練、推論平均效能表現。這等同於只需原本1/5的伺服器數量，就能提供相同的效能，並可改善3倍整體持有成本（TCO）與3.5倍能原效率，對用戶來說是相當划算的投資。

NVIDIA超大規模與高效能運算副總裁Ian Buck在簡報中特別說明，現在大型語言模型占據AI運算相當大的比重，例如圖像產生、推薦系統、科學研究、翻譯、文字產生、AI編寫程式都需要大型語言模型的協助。

全新的H100能提供5倍於A100的大型語言模型訓練效能，以及30倍推論效能，提升幅度相當顯著，此外NVIDIA也會推出NeMo LLM Service雲端服務，提供用戶更具彈性的解決方案。

▲ 採用Hooper架構的H100 GPU將以多種型式陸續投入市場。

▲ HGX H100伺服器有著5倍於前代HGX A100的AI訓練、推論平均效能表現。

▲ 圖像產生、推薦系統、科學研究、翻譯、文字產生、AI編寫程式都需要大型語言模型的協助，大型語言模型相關論文也日益增加。

▲ H100能提供5倍於A100的大型語言模型訓練效能，以及30倍推論效能。

▲ NVIDIA也將推出NeMo LLM Service雲端服務。

多款運算平台齊發

NVIDIA也在這次GTC發表了多款全新運算硬體與雲端解決方案。首先我們看到針對醫療以及自動化工業應用所推出的IGX，其搭載的Orin模組具有250 TOPS的運算能力，並可擴充高達600 TOPS運算能力的RTX Ampere GPU，同時也搭載ConnectX-7 400GbE串流I/O介面，能夠連接多種外部裝置、現有醫療儀器，進行即時醫療圖像分析以及執行各種AI程式。

而針對智慧型車輛所設計的DRIVE Thor車用SoC，它具有2000 TOPS的FP8資料類型運算能力，並可搭配Hooper GPU、次世代GPU、Grace CPU等不同運算單元，提供充沛且冗餘的運算效能，以同時滿足輔助駕駛、自動駕駛、車用娛樂的需求。不過在這同時NVIDIA也宣佈取消先前的DRIVE Atlan產品（其運算能力僅有1000 TOPS），未來僅會實際推出DRIVE Thor相關產品。

為了為邊緣AI裝置或自走車、機械手臂等小型自動化工業裝置提供更充沛的AI運算效能，NVIDIA也將Orin下放至「Nano家族」，推出Orin Nano運算模組，它具有6個Arm Cortex-A78處理器核心，並可藉由Ampere架構GPU提供40 TOPS INT8資料類型運算能力，整體能夠帶來80倍於Jetson Nano的效能表現，提供4GB、8GB等規格選擇，價格由美金199元（約合新台幣6,295元）起，但不會推出Orin Nano開發者套件。

在元宇宙與Omniverse應用方面，NVIDIA除了推出第2代OVX電腦之外，也宣佈以SaaS（Software as a Service，軟體即服務）的型式推出Omniverse Cloud雲端服務，讓沒有硬體環境的用戶也能快速投入開發流程。

▲ IGX是為醫療以及自動化工業應用所推出的運算平台。