ADVERTISEMENT
最強雲端運算、最快GPU,聯手出大絕了!雲端運算霸主亞馬遜雲端科技和NVIDIA宣佈:
推出首款雲AI超級電腦,結合了NVIDIA H200 Grace Hopper超級晶片和亞馬遜UltraCluster擴充功能。
據悉,該合作專案代號為Project Ceiba,而這個超級電腦是配備了H200 NVL32與Amazon EFA互連技術的大規模系統,將部署在亞馬遜雲端科技之上。
它共計搭載了16384顆NVIDIAH200超級晶片,能夠處理65 exaflops速度等級的AI運算。
ADVERTISEMENT
為了這個合作專案,老黃也是親自來到亞馬遜雲端科技年度盛會re:Invent的現場月臺,重視程度可見一斑。
與此同時,亞馬遜雲端科技也成為了NVIDIAH200 Grace Hopper超級晶片的第一個大客戶。
ADVERTISEMENT
而之所以兩大巨頭要這般合作,雙方的目標也是非常明確——劍指生成式AI。
亞馬遜雲端科技CEO Adam Selipsky在現場表示:
我們與NVIDIA合作了13年,推出了最廣泛的NVIDIA GPU解決方案可用於各種工作負載,包括繪圖、遊戲、HPC高性能運算、機器學習,以及現在的生成式AI。
我們將會讓亞馬遜雲端科技成為運行GPU的最佳雲端環境。
黃仁勳也對生成式AI與雲端運算發表了他的觀點:
ADVERTISEMENT
生成式AI正改變各種雲端負載,為多元內容創作在底層注入加速運算動能。
我們共同目標是為每個客戶提供具有成本效益、先進生成式AI,為此NVIDIA與亞馬遜雲端科技在整個計算堆疊展開合作,橫跨AI基礎設施、加速庫、基礎模型以及生成式AI服務。
而這次強強聯手的合作,也僅僅是亞馬遜雲端科技 re:Invent活動中的一隅。
現在,我們就來一同看下更多的重量級發表。
亞馬遜雲端科技升級AI晶片
除了與NVIDIA展開合作之外,亞馬遜雲端科技自家的晶片也迎來了大升級。
ADVERTISEMENT
首先便是發表了升級後的通用AI晶片——Graviton4。
據瞭解,與上一代Graviton3相比,Graviton4的運算性能提高了30%,核心數量增加了50%,記憶體頻寬增加了75%。
Graviton4帶來的一個新轉變之一,便是通過對所有快速物理硬體介面的全面加密,這就顯著提升了它的安全性。
亞馬遜雲端科技透露,這款晶片將被應用於記憶體最佳化型的Amazon EC2 R8g實例,説明客戶提升高性能資料庫、記憶體緩存和大資料分析工作的效率。
而且,R8g實例的大小更大,其vCPU和記憶體容量比前一代的R7g實例最多增加了三倍。
搭載Graviton4的電腦預計在接下來的幾個月內上市。
亞馬遜雲端科技進一步表示:
自從大約五年前推出Graviton專案以來,他們已經生產了超過200萬個Graviton處理器。
而且,亞馬遜雲端科技 EC2的前100位使用者都已經選擇使用Graviton,這證明了其在市場上的受歡迎程度。
亞馬遜雲端科技在大會中帶來的第二款升級晶片,則是Trainum2。
如其名,這款晶片的主要用途就是針對擁有超大參數模型的訓練。
相比於上一代Trainium1,Trainum2在速度上快出了4倍,同時在能效方面也有2倍的提升。
在亞馬遜雲端科技內部,Amazon EC2 Trn2實例將採用的正是Trainium2,每個實例內建16個Trainium晶片。
這些Trn2實例的目的是為了支援客戶在下一代EC2 UltraCluster中大規模擴充,最多可達10萬個Trainium2晶片,通過亞馬遜雲端科技彈性織物適配器(EFA)的petabit級網路連接,能夠提供高達65 exaflops的強大運算能力。
有了這種規模,客戶就可以在數周而不是數月時間內訓練3000億參數的大語言模型!
正如Claude背後公司Anthropic的聯合創始人Tom Brown所述:
我們正在與亞馬遜雲端科技密切合作,使用Trainium晶片開發我們未來的基礎模型。
Trainium2將説明我們大規模構建和訓練模型,我們預計它比第一代Trainium晶片快至少4倍,適用於我們的一些關鍵工作負載。
據悉,Trainium2將從明年開始用於支援新的服務。
Amazon Q:亞馬遜工作版ChatGPT出道
在生成式AI方面,亞馬遜雲端科技還發表了自家工作版的ChatGPT——Amazon Q,重新構想了未來的工作方式。
Amazon Q主要面向的是企業使用者,它讓員工可以利用公司的資料和專業知識獲得答案、解決問題。
Amazon Q基於亞馬遜雲端科技17年的知識來訓練,所以很懂亞馬遜雲端科技,於是在使用亞馬遜雲端科技過程中,可以隨時隨地提供幫助。
Adam說,Amazon Q改變了開發人員在亞馬遜雲端科技上構建、部署和操作應用程式的方式。
它可以通過提出問題來瞭解亞馬遜雲端科技功能和工作原理,或者確定最佳服務。
Amazon Q不僅能介紹亞馬遜雲端科技的各項功能,還可以根據使用者需求,提供利用亞馬遜雲端科技各項服務構建應用的方法。
在使用亞馬遜雲端科技遇到問題和故障時,Amazon Q也可以一鍵分析原因並想辦法解決。
在亞馬遜雲端科技控制台之外,Amazon Q還可以在IDE中調用,即時幫助開發者生成或解釋程式碼,並進行測試和最佳化。
更為精彩的是,Amazon Q可以完成從計畫到程式碼,再到完成後的測試和使用者檔案的全流程自動開發。
假如要給應用加入新功能,開發人員只需要用自然語言描述需求,然後檢查Amazon Q給出的建議並進行必要調整就可以了。
不過,開發不是一勞永逸,程式的維護和升級也至關重要。
而如果這之中涉及到了程式設計語言的更新反覆運算,開發者可能需要花費幾個月甚至幾年對程式碼進行逐行調整。
而Amazon Q的程式碼轉換功能,將這一時間縮短到了幾分鐘。
開發人員只需在 IDE 中打開他們想要轉換的程式碼,然後要求Amazon Q對其進行「/transform」即可。
最近,5名開發人員用Amazon Q在短短兩天內將1000個應用從Java 8升級到Java 17,平均每個用時還不到10分鐘。
除了面向開發者的Builder版本, Amazon Q還有為商業從業者提供的Business版本。
可以在亞馬遜QuickSight資料分析平臺和亞馬遜雲端科技 Connect中使用。
將Amazon Q連接到企業系統,還能得到定製版的Q,我們還可以看到Amazon Q説明使用者分析了下游客戶的需求。
在此基礎之上,Amazon Q更是可以直接充當使用者的客服代表,解決下游使用者提出的問題。
做個總結的話,Business版本的Amazon Q一共擁有四重「專家」身份:
- 亞馬遜雲端科技專家,對亞馬遜雲端科技的每一個功能、模組都有充分的瞭解。
- 生意專家,能夠分析行業狀況下游客戶的需求。
- 商業智慧專家,能夠對大量商業資料進行分析。
- 客服專家,對使用者企業情況充分瞭解,可以充當智慧客服工作。
價格方面,Business和Builder版本的價格分別是每使用者每月20美元和25美元。
還有其它發表
與這些晶片和聊天機器人Amazon Q同時發表的,還有全新的雲存儲服務亞馬遜雲端科技 S3 Express One Zone。
它的速度是標準版S3的10倍,可以在1分鐘之內處理數百萬次請求,請求成本和運算成本分別降低了50%和60%。
工具層面,生成式AI應用搭建平臺Bedrock也值得關注。
Adam將其稱作最簡單的利用大模型搭建和擴充生成式AI的方式。
此外還有和Trainium晶片配套的ML最佳化SDK 亞馬遜雲端科技 Neuron。
排行前100的ML模型中,亞馬遜雲端科技 Neuron支持93種。
按照基礎設施層、工具層和應用層這三個層級進行劃分,此次發表中涉及生成式AI的產品都在下面這張圖裡了:
資料來源:
ADVERTISEMENT