16000顆NVIDIA H200 Grace Hopper超級晶片合體亞馬遜UltraCluster最強雲端運算,推出雲端AI超級電腦

16000顆NVIDIA H200 Grace Hopper超級晶片合體亞馬遜UltraCluster最強雲端運算,推出雲端AI超級電腦

ADVERTISEMENT

最強雲端運算、最快GPU,聯手出大絕了!雲端運算霸主亞馬遜雲端科技和NVIDIA宣佈: 

推出首款雲AI超級電腦,結合了NVIDIA H200 Grace Hopper超級晶片和亞馬遜UltraCluster擴充功能。 

據悉,該合作專案代號為Project Ceiba,而這個超級電腦是配備了H200 NVL32與Amazon EFA互連技術的大規模系統,將部署在亞馬遜雲端科技之上。 

它共計搭載了16384顆NVIDIAH200超級晶片,能夠處理65 exaflops速度等級的AI運算。 

為了這個合作專案,老黃也是親自來到亞馬遜雲端科技年度盛會re:Invent的現場月臺,重視程度可見一斑。

左:亞馬遜雲端科技 CEO:Adam Selipsky;右:NVIDIA CEO:黃仁勳

與此同時,亞馬遜雲端科技也成為了NVIDIAH200 Grace Hopper超級晶片的第一個大客戶。 

而之所以兩大巨頭要這般合作,雙方的目標也是非常明確——劍指生成式AI。 

亞馬遜雲端科技CEO Adam Selipsky在現場表示: 

我們與NVIDIA合作了13年,推出了最廣泛的NVIDIA GPU解決方案可用於各種工作負載,包括繪圖、遊戲、HPC高性能運算、機器學習,以及現在的生成式AI。

我們將會讓亞馬遜雲端科技成為運行GPU的最佳雲端環境。

黃仁勳也對生成式AI與雲端運算發表了他的觀點: 

生成式AI正改變各種雲端負載,為多元內容創作在底層注入加速運算動能。

我們共同目標是為每個客戶提供具有成本效益、先進生成式AI,為此NVIDIA與亞馬遜雲端科技在整個計算堆疊展開合作,橫跨AI基礎設施、加速庫、基礎模型以及生成式AI服務。

而這次強強聯手的合作,也僅僅是亞馬遜雲端科技 re:Invent活動中的一隅。 

現在,我們就來一同看下更多的重量級發表。 

亞馬遜雲端科技升級AI晶片

除了與NVIDIA展開合作之外,亞馬遜雲端科技自家的晶片也迎來了大升級。 

首先便是發表了升級後的通用AI晶片——Graviton4。 

16000顆NVIDIA H200 Grace Hopper超級晶片合體亞馬遜UltraCluster最強雲端運算,推出雲端AI超級電腦

據瞭解,與上一代Graviton3相比,Graviton4的運算性能提高了30%,核心數量增加了50%,記憶體頻寬增加了75%。

16000顆NVIDIA H200 Grace Hopper超級晶片合體亞馬遜UltraCluster最強雲端運算,推出雲端AI超級電腦

 

Graviton4帶來的一個新轉變之一,便是通過對所有快速物理硬體介面的全面加密,這就顯著提升了它的安全性。 

亞馬遜雲端科技透露,這款晶片將被應用於記憶體最佳化型的Amazon EC2 R8g實例,説明客戶提升高性能資料庫、記憶體緩存和大資料分析工作的效率。 

而且,R8g實例的大小更大,其vCPU和記憶體容量比前一代的R7g實例最多增加了三倍。 

搭載Graviton4的電腦預計在接下來的幾個月內上市。 

亞馬遜雲端科技進一步表示: 

自從大約五年前推出Graviton專案以來,他們已經生產了超過200萬個Graviton處理器。

而且,亞馬遜雲端科技 EC2的前100位使用者都已經選擇使用Graviton,這證明了其在市場上的受歡迎程度。

亞馬遜雲端科技在大會中帶來的第二款升級晶片,則是Trainum2。 

如其名,這款晶片的主要用途就是針對擁有超大參數模型的訓練。

16000顆NVIDIA H200 Grace Hopper超級晶片合體亞馬遜UltraCluster最強雲端運算,推出雲端AI超級電腦

相比於上一代Trainium1,Trainum2在速度上快出了4倍,同時在能效方面也有2倍的提升。 

在亞馬遜雲端科技內部,Amazon EC2 Trn2實例將採用的正是Trainium2,每個實例內建16個Trainium晶片。 

這些Trn2實例的目的是為了支援客戶在下一代EC2 UltraCluster中大規模擴充,最多可達10萬個Trainium2晶片,通過亞馬遜雲端科技彈性織物適配器(EFA)的petabit級網路連接,能夠提供高達65 exaflops的強大運算能力。 

有了這種規模,客戶就可以在數周而不是數月時間內訓練3000億參數的大語言模型! 

正如Claude背後公司Anthropic的聯合創始人Tom Brown所述: 

我們正在與亞馬遜雲端科技密切合作,使用Trainium晶片開發我們未來的基礎模型。

Trainium2將説明我們大規模構建和訓練模型,我們預計它比第一代Trainium晶片快至少4倍,適用於我們的一些關鍵工作負載。

據悉,Trainium2將從明年開始用於支援新的服務。 

Amazon Q:亞馬遜工作版ChatGPT出道

在生成式AI方面,亞馬遜雲端科技還發表了自家工作版的ChatGPT——Amazon Q,重新構想了未來的工作方式。 

Amazon Q主要面向的是企業使用者,它讓員工可以利用公司的資料和專業知識獲得答案、解決問題。

16000顆NVIDIA H200 Grace Hopper超級晶片合體亞馬遜UltraCluster最強雲端運算,推出雲端AI超級電腦

 

Amazon Q基於亞馬遜雲端科技17年的知識來訓練,所以很懂亞馬遜雲端科技,於是在使用亞馬遜雲端科技過程中,可以隨時隨地提供幫助。 

Adam說,Amazon Q改變了開發人員在亞馬遜雲端科技上構建、部署和操作應用程式的方式。 

它可以通過提出問題來瞭解亞馬遜雲端科技功能和工作原理,或者確定最佳服務。

16000顆NVIDIA H200 Grace Hopper超級晶片合體亞馬遜UltraCluster最強雲端運算,推出雲端AI超級電腦

Amazon Q不僅能介紹亞馬遜雲端科技的各項功能,還可以根據使用者需求,提供利用亞馬遜雲端科技各項服務構建應用的方法。

16000顆NVIDIA H200 Grace Hopper超級晶片合體亞馬遜UltraCluster最強雲端運算,推出雲端AI超級電腦

在使用亞馬遜雲端科技遇到問題和故障時,Amazon Q也可以一鍵分析原因並想辦法解決。

16000顆NVIDIA H200 Grace Hopper超級晶片合體亞馬遜UltraCluster最強雲端運算,推出雲端AI超級電腦

在亞馬遜雲端科技控制台之外,Amazon Q還可以在IDE中調用,即時幫助開發者生成或解釋程式碼,並進行測試和最佳化。

16000顆NVIDIA H200 Grace Hopper超級晶片合體亞馬遜UltraCluster最強雲端運算,推出雲端AI超級電腦

更為精彩的是,Amazon Q可以完成從計畫到程式碼,再到完成後的測試和使用者檔案的全流程自動開發。 

假如要給應用加入新功能,開發人員只需要用自然語言描述需求,然後檢查Amazon Q給出的建議並進行必要調整就可以了。 

16000顆NVIDIA H200 Grace Hopper超級晶片合體亞馬遜UltraCluster最強雲端運算,推出雲端AI超級電腦

不過,開發不是一勞永逸,程式的維護和升級也至關重要。 

而如果這之中涉及到了程式設計語言的更新反覆運算,開發者可能需要花費幾個月甚至幾年對程式碼進行逐行調整。 

而Amazon Q的程式碼轉換功能,將這一時間縮短到了幾分鐘。 

開發人員只需在 IDE 中打開他們想要轉換的程式碼,然後要求Amazon Q對其進行「/transform」即可。 

最近,5名開發人員用Amazon Q在短短兩天內將1000個應用從Java 8升級到Java 17,平均每個用時還不到10分鐘。

16000顆NVIDIA H200 Grace Hopper超級晶片合體亞馬遜UltraCluster最強雲端運算,推出雲端AI超級電腦

除了面向開發者的Builder版本, Amazon Q還有為商業從業者提供的Business版本。 

可以在亞馬遜QuickSight資料分析平臺和亞馬遜雲端科技 Connect中使用。 

將Amazon Q連接到企業系統,還能得到定製版的Q,我們還可以看到Amazon Q説明使用者分析了下游客戶的需求。

16000顆NVIDIA H200 Grace Hopper超級晶片合體亞馬遜UltraCluster最強雲端運算,推出雲端AI超級電腦

在此基礎之上,Amazon Q更是可以直接充當使用者的客服代表,解決下游使用者提出的問題。 

16000顆NVIDIA H200 Grace Hopper超級晶片合體亞馬遜UltraCluster最強雲端運算,推出雲端AI超級電腦

做個總結的話,Business版本的Amazon Q一共擁有四重「專家」身份: 

  • 亞馬遜雲端科技專家,對亞馬遜雲端科技的每一個功能、模組都有充分的瞭解。
  • 生意專家,能夠分析行業狀況下游客戶的需求。
  • 商業智慧專家,能夠對大量商業資料進行分析。
  • 客服專家,對使用者企業情況充分瞭解,可以充當智慧客服工作。 

16000顆NVIDIA H200 Grace Hopper超級晶片合體亞馬遜UltraCluster最強雲端運算,推出雲端AI超級電腦

價格方面,Business和Builder版本的價格分別是每使用者每月20美元和25美元。 

還有其它發表

與這些晶片和聊天機器人Amazon Q同時發表的,還有全新的雲存儲服務亞馬遜雲端科技 S3 Express One Zone。 

它的速度是標準版S3的10倍,可以在1分鐘之內處理數百萬次請求,請求成本和運算成本分別降低了50%和60%。  

16000顆NVIDIA H200 Grace Hopper超級晶片合體亞馬遜UltraCluster最強雲端運算,推出雲端AI超級電腦

工具層面,生成式AI應用搭建平臺Bedrock也值得關注。 

Adam將其稱作最簡單的利用大模型搭建和擴充生成式AI的方式。 

16000顆NVIDIA H200 Grace Hopper超級晶片合體亞馬遜UltraCluster最強雲端運算,推出雲端AI超級電腦

此外還有和Trainium晶片配套的ML最佳化SDK 亞馬遜雲端科技 Neuron。 

排行前100的ML模型中,亞馬遜雲端科技 Neuron支持93種。 

16000顆NVIDIA H200 Grace Hopper超級晶片合體亞馬遜UltraCluster最強雲端運算,推出雲端AI超級電腦

按照基礎設施層、工具層和應用層這三個層級進行劃分,此次發表中涉及生成式AI的產品都在下面這張圖裡了: 

16000顆NVIDIA H200 Grace Hopper超級晶片合體亞馬遜UltraCluster最強雲端運算,推出雲端AI超級電腦

資料來源:

Qbitai
作者

量子位(Qbitai)專注於人工智慧及前沿科技領域,提供技術研發趨勢、科技企業動態、新創公司報道等最新資訊,以及機器學習入門資源、電腦科學最新研究論文、開源程式碼和工具的相關報導。

使用 Facebook 留言
發表回應
謹慎發言,尊重彼此。按此展開留言規則