NVIDIA於GTC 2023春季展發表多樣AI技術,帶來更多生成式AI還能用AI加速晶片設計與生產

NVIDIA於GTC 2023春季展發表多樣AI技術,帶來更多生成式AI還能用AI加速晶片設計與生產

ADVERTISEMENT

NVIDIA於GTC 2023春季展發表多款生成式AI技術應用,以及多種的「平台即服務」的AI雲端服務,還有與半導體領導企業共同研發的cuLitho函數庫。

多種AI應用與服務

NVIDIA將持續推廣DGX CloudOmniverse Cloud等雲端服務,並推出的AI Foundations建構於DGX雲端服務以及AI Enterprise平台上,透過NeMO大型語言模型、Picasso圖像生成、BioNeMO智慧藥物研發等技術提供企業更多樣的客製化生成式AI服務。

其中Picasso與大家熟悉的「AI電繪」類似,但它不只可以將文字描述轉換為圖像,甚至還可以生成影片與3D模型,應用範圍更加多元。NVIDIA與全球視覺內容創造及內容交易市集Getty Images合作,訓練負責任的生成式AI圖片、影片(Generative Text-to-Image, Text-to-Video)基礎模型,讓使用者能夠透過文字提示產出圖片和影片,過程使用Getty Images完全授權的圖像進行訓練,並會向藝術家提供這些模型所產生之任何收入的版稅。

NVIDIA也與全球創意平台Shutterstock合作,服務訓練生成式AI 3D建模(Generative Text-to-3D)基礎模型,簡化製作3D模型的工作時間,只需幾分鐘就能完成原本需要幾天的工作進度。其過程使用完全授權的Shutterstock圖像與資料,並通過投稿人基金來補償藝術家。未來Shutterstock也計劃將此模型推廣至其平台,以簡化3D建模工作,並快速在Omniverse中發展工業數位孿生及建構3D虛擬世界的進度。

企業用戶可以透過網路瀏覽器存取執行於DGX Cloud的NeMo與Picasso服務,開發人員可以透過API輕鬆調用各種AI模型,並透過AI Foundations執行大規模地AI推論,並享有預先訓練好的模型、資料處理框架、向量資料庫和個人化、最佳化的推論引擎、應用程式設計介面、NVIDIA技術支援等6大優勢,協企業針對需求進行AI模型最佳化。

此外NVIDIA也會推出全新H100 NVL、L4等採用PCIe介面的運算卡,將旗下推論平台擴充至4種機型,並維持單一架構與單一軟體堆疊,滿足企業更多元與不同量級的AI運算需求。H100 NVL是部署ChatGPT等大規模語言模型的理想選擇,它具有94GB記憶體與Transformer加速引擎,並可透過NVLINK串接組合為188GB記憶體,執行GPT-3推論的效能為前代A100的12倍。L4則是單槽、半高的輕量運算卡,能夠安裝於多數伺服器,讓現有的伺服器也能輕鬆擴充AI運算功能,帶來較處理器(CPU) 高出120倍的AI影片生成效能,能源效率也提升99%。

ChatGPT是最近相當熱門的生成式AI應用,它只花了2個月就達到1億使用者的里程盃。

NVIDIA推出AI Foundations平台以NeMO大型語言模型、Picasso圖像生成、BioNeMO智慧藥物研發等生成式AI服務。

Picasso與大家熟悉的「AI電繪」類似,可以將文字描述轉換為圖像、影片或3D模型,企業用戶可以透過DGX Cloud存取此服務。

舉例來說,Picasso可以將文字描述轉換為靜態圖像。

Picasso也可以生成動態影片。(實際上圖中的水母會動)

Picasso甚至能透過文字產品3D模型。

L4運算卡為針對AI影片工作負載設計,可以加速影片解碼與轉碼、內容審核、背景替換、調整照明、眼神交流、抄錄逐字稿、即時影片翻譯功能。1台搭載8張L4伺服器的AI影片效能可以媲美100多台雙處理器伺服器。

現有的L40運算卡針對 Omniverse、繪圖運算渲染、AI影像生成、AI影片生成等應用設計,其效能可達最流行的雲端推論GPU T4的10倍以上。

H100 NVL運算卡採用Hopper架構GPU,搭載容量達94GB的HBM3記憶體,並可透過NVLINK串接,並支援商用 PCIe伺服器,發揮輕易地橫向擴充之目的。與目前雲端唯一可以實際處理ChatGPT的HGX A100超級電腦相比,搭載擁有4對雙GPU NVLINK的H100標準伺服器效能表現可達前者的10倍。

Grace Hopper是NVIDIA的全新超級晶片,透過頻寬高達900GB/s的晶片內互連介面連接Grace CPU和Hopper GPU,讓它非常適合處理大型資料集,應用於推薦系統和大型語言模型的AI資料庫。。

TSMC導入AI提生晶片生產效率

NVIDIA也與ASML、TSMC(台積電)、Synopsys等半導體領導企業共同研發能夠加速晶片設計與製造的技術,克服來自半導體製程即將面臨物理極限的挑戰。

cuLitho是款針對運算式微影(Computational Lithography)技術開發的函數庫,可以透過GPU加速微影成像模擬與校正,強化自動量測和檢測的效果,確保微影製程中電路精準度,提升製程控制能力以及良率。

目前TSMC已經將cuLitho整合至生產流程,Synopsys也將其導入晶片自動化設計軟體,而NVIDIA Hopper架構GPU就是受益於這項新技術。半導體設備製造商ASML也正與NVIDIA密切合作,計劃在旗下所有微影軟體中納入支援GPU加速功能。

NVIDIA表示透過GPU加速的cuLitho,能夠提供高於目前微影技術40倍的性能躍升,它搭載500組DGX H100 GPU的系統能夠完成40,000組CPU系統的工作,並可完成運算式微影流程的所有環節,有助於減少電力消耗並降低環境衝擊。

cuLitho的短期優勢在於能夠協助晶圓廠每天多生產3~5倍的光罩(Photomask),並較目前系統節省9倍電力消耗,在一夜之內完成過去需要花費2週的工作流程。至於長遠來看,cuLitho能夠達到改善設計、增加電晶體密度、提升產能,以及將AI導入微影製程,強化半導體設計與生產能力。

NVIDIA也提到在半導體製程中,「運算時間」也成為企業需要考量的成本,隨著新製程節點中的晶體管數量更多,對精確度的需求也越來越高,因此設計過程所需的運算效能也跟著提高,讓所需時間成本超出摩爾定律的預測,將導致拖慢半導體創新的步調伐。cuLitho可以消除這些瓶頸,並提升光學接鄰修正(Optical Proximity Correction,OPC)的修訂速度,甚至能促成曲線光罩(Curvilinear Mask)、高數值孔徑極紫外光微影(High NA EUV Lithography)、次原子光阻劑建模(Sub-Atomic Photoresist Modeling)等新技術之發展。

在晶片設計時,需要考慮實際上最終在晶圓上形成的圖案與光罩上的圖案並不相同,因此運算式微影技術採用「逆向工程」的概念,以預測什麼樣的光罩圖案會在晶圓上形成最終需要的圖案。

在晶片生產過程中,晶圓需每秒定位20,000次且保持在0.25奈米範圍內,以修正振動的影響。ASML透過GPU加速此修正的運算效率。

另一方面,在生產過程中運算式微影技術會透過馬克斯威方程組模擬光線通過光學元件以及光阻劑互相作用的行為,因而消耗相當大量的運算資源。這項運算負載每年將消耗數百億個CPU工時,不但耗費晶片製造商每年近美金2,000億的資本支出,也讓伺服器占用的廠房空間成為營運成本,使用GPU加速將可省下相當可觀的成本。

你可以從NVIDIA提供的照片資料看出什麼端倪嗎?

cuLitho是NVIDIA與TSMC(台積電)、ASML和Synopsys密切合作近4年的成果,能將運算式微影技術的效率提升40倍以上。TSMC將於2023年6月起cuLitho改善晶片生產的品質控管。

TSMC執行長魏哲家也表示,cuLitho在加速運算式微影方面取得了令人欽佩的進展,並將高成本的運算負載轉移至GPU,為TSMC開創了反向微影(Inverse Lithography)等新技術的可能性,以及在晶片製造中更廣泛導入深度學習,為半導體微縮做出重要貢獻。

GTC將於2023年3月20日至24日間舉辦眾多線上活動以及由專家主持的演講,更多資訊可以參考GTC官方網頁以及我們的後續報導。

國寶大師 李文恩
作者

電腦王特約作者,專門負責硬派內容,從處理器、主機板到開發板、零組件,尖端科技都一手包辦,最近的研究計畫則包括Windows 98復活與AI圖像生成。

使用 Facebook 留言
發表回應
謹慎發言,尊重彼此。按此展開留言規則