ADVERTISEMENT
對AI的興趣激增,正帶來對運算能力的巨大需求。全球各地的公司正努力追趕所需的大量GPU,以支撐越來越先進的AI模型。雖然GPU並不是運行AI模型的唯一選擇,但由於它們能夠高效地同時處理多項運算,這一關鍵特性使其成為開發深度學習模型的首選硬體。
然而,並非所有AI初創公司都擁有足夠的資本來投資運行尖端模型所需的大量GPU。對某些公司而言,將此需求外包是一個更划算的選擇。這導致了一種新業務的興起:「GPU即服務」(GPU-as-a-Service,簡稱GPUaaS)。近年來,Hyperbolic、Kinesis、Runpod和Vast.ai等公司紛紛成立,為客戶遠端提供所需的運算能力。
與Amazon或Microsoft等提供雲端運算服務的大型科技巨頭擁有自己的基礎設施不同,像Kinesis這樣的小型初創公司則採用了技術手段,充分利用現有的閒置運算資源。
ADVERTISEMENT
「企業需要運算能力。他們需要訓練模型或運行應用程式,但不一定需要擁有或管理伺服器。」Kinesis聯合創始人比娜‧希馬尼(Bina Khimani)表示。
研究表明,現有GPU中有超過一半在任何時刻都處於閒置狀態。無論是個人電腦還是龐大的伺服器群,大量的處理能力都沒有得到充分利用。 Kinesis 所做的就是辨識全球伺服器中閒置的 GPU 和 CPU 運算能力,並將它們整合到單一運算資源中供企業使用。 Kinesis 與大學、資料中心、公司和個人合作,這些大學、資料中心、公司和個人願意出售其未使用的運算能力。 Kinesis 通過安裝在其伺服器上的特殊軟體,可以檢測閒置的處理單元,並對其進行準備,然後將它們提供給客戶臨時使用。
「在Kinesis,我們開發了技術,將分散的閒置運算能力匯集並重新利用,構建了一個無伺服器、自動管理的運算平台。」希馬尼表示。Kinesis的客戶甚至可以選擇希望其GPU或CPU來自何處。
ADVERTISEMENT
AI的發展速度快於伺服器的供應能力
GPUaaS正在填補AI行業日益增長的缺口。隨著學習模型越來越複雜,它們需要更多的運算能力以及能更快處理訊息的基礎設施。換句話說,沒有足夠數量的GPU,大型AI模型無法運行,更不用說改進了。2023年10月,OpenAI執行長山姆‧阿特曼(Sam Altman)承認,由於運算能力的「諸多限制」,公司無法以希望的頻率推出產品。
同樣在10月,Microsoft財務長艾米‧伍茲(Amy Woods)在與公司投資者的電話會議中表示,AI需求「持續高於」公司「可用的產能」。
ADVERTISEMENT
GPUaaS最大的優勢在於經濟性。透過消除購買和維護實體基礎設施的需求,GPUaaS使企業無需投資於伺服器和IT管理,而是能將資源集中於改進自己的深度學習、大型語言和大型視覺模型。同時,它還允許客戶根據實際使用的GPU數量付款,進而節省購置伺服器時無可避免的閒置運算成本。
像Kinesis這樣的無伺服器初創公司還聲稱比傳統雲端運算公司更環保。透過利用現有、未使用的處理單元,而非為每個新應用程式增加更多伺服器,他們表示可以顯著減少能源消耗。在過去五年中,Google和Microsoft等大型科技公司因AI所消耗的能源量,導致其碳排放急劇上升。作為應對,部分公司已將目光投向核能,以可持續地為伺服器供電。而Kinesis等初創公司則提供了一條第三種途徑,無需連接更多的伺服器。
「行業領袖對可持續性高度重視。」希馬尼表示。「透過專注於創新和效率,他們可以最佳化現有的、已經啟動並消耗能源的運算能力,而不是為了他們執行的每個新應用程式而不斷增加伺服器。」
ADVERTISEMENT
對機器學習和海量資料消耗不斷增長的需求,正將 GPUaaS 轉變為一個非常有利可圖的科技產業。 2023 年,該產業的市場規模為 32.3 億美元(約 993 億新台幣); 2024 年,增長到 43.1 億美元(約 1329 億新台幣)。 預計到 2032 年將增長到 498.4 億美元(約 1.53 兆新台幣)。
「人工智慧產業正在快速發展到一個階段,重點正在從僅僅建立和訓練模型轉向最佳化效率,」希馬尼說。 「客戶越來越多地提出這樣的問題:『在訓練新模型時,我們怎樣才能做到有的放矢,而不是消耗海量的資料,而這些資料需要大量的運算和能源?』」
ADVERTISEMENT