從 OpenAI 到 DeepSeek ,為何大家還在搶 AI 晶片?

從 OpenAI 到 DeepSeek ,為何大家還在搶 AI 晶片?

即使投資者一度抱持懷疑,大型科技公司、國家政府和創投仍以前所未有的規模向人工智慧投入資金。要理解箇中原因,我們需要了解人工智慧本身正在發生的變化。技術正從傳統的大型語言模型轉向推理模型和人工智慧代理。

訓練傳統的大型語言模型(你在大多數人工智慧聊天機器人的免費版本中遇到的那種)需要大量的電力和運算時間。但我們正快速找到減少它們在人類調用時執行所需資源的方法。推理模型基於大型語言模型,不同之處在於它們的實際運行消耗更多資源,包括微晶片和電力。

推理模型崛起:運算需求更勝以往

自 OpenAI 在 9 月預覽其第一個推理模型 o1 以來,人工智慧公司一直在競相發布能夠與之競爭的系統。這包括 DeepSeek 的 R1(在今年年初震撼了人工智慧界以及許多科技和電力公司的估值),以及伊隆·馬斯克的 xAI(剛剛推出了其 Grok 3 推理模型)。

DeepSeek 引發了一場恐慌,因為它表明可以用比其他模型低得多的成本訓練人工智慧模型,這可能會減少對資料中心和昂貴的高階晶片的需求。但 DeepSeek 實際上做的是將人工智慧產業推向資源密集型推理模型,這意味著運算基礎設施仍然非常需要。

由於其增強的功能,這些推理系統很可能很快成為人們在許多任務中使用人工智慧的預設方式。OpenAI 執行長阿特曼表示,該公司人工智慧模型的下一次重大升級將包括高階推理功能。

為什麼推理模型以及它們所支援的產品(如「深度研究」工具和人工智慧代理)需要更多的電力?答案在於它們的工作方式。

推理模型運算資源需求高百倍

NVIDIA 人工智慧產品管理副總裁卡里·布里斯基在最近的一篇官方文章中寫道,人工智慧推理模型可以輕鬆使用比傳統大型語言模型多 100 倍的運算資源。這種倍增效應來自於推理模型花費數分鐘甚至數小時與自己對話(並非使用者都能看到),形成一個漫長的「思維鏈」。模型使用的運算資源量與生成的單詞數成正比,因此生成 100 倍單詞來回答問題的推理模型將使用更多的電力和其他資源。

當推理模型去存取網路時,情況會變得更加資源密集,例如 Google、Open AI 和 Perplexity 的「深度研究」模型。

這些對運算能力的需求只是開端。反映這一點,Google、微軟和 Meta Platforms 計劃在 2025 年集體支出至少 2150 億美元的資本支出,其中大部分用於人工智慧資料中心。這將比他們去年的資本支出增加 45%。

為了展示對未來人工智慧需求的預測,我們可以列出一個簡單的等式。

等式中的第一個值是處理人工智慧(如 ChatGPT)中的單個資訊 tokens 所需的運算資源量。

DeepSeek 引發產業轉向:資源密集型推理模型成主流

一月,在中國人工智慧模型 DeepSeek R1 發布後,每個 tokens 的成本(包括運算能力和美元)似乎會暴跌。DeepSeek 及其隨附的論文表明,以一種比美國人工智慧實驗室先前揭露的方法更有效的方式訓練和交付人工智慧是可能的。

從表面上看,這似乎表明人工智慧未來對運算能力的需求將是當前數量的十分之一甚至更少。但推理模型在回答查詢時增加的需求可能會彌補這一點。最簡單地說,如果基於 DeepSeek 見解的新型更高效人工智慧模型將人工智慧的運算能力需求削減十分之一,但推理模型成為標準並將這些模型的需求增加 100 倍,那麼未來人工智慧的電力需求仍然會增加 10 倍。

這只是起點。隨著企業發現新型人工智慧模型功能更強大,他們越來越頻繁地調用它們。這正在將運算能力的需求從訓練模型轉向使用它們,即人工智慧產業所說的「推理」。

為其他公司提供人工智慧運算資源的 Baseten 執行長圖欣·斯里瓦斯塔瓦表示,向推理的轉變已經開始。他的客戶包括在其應用程式和服務中使用人工智慧的科技公司,例如 Descript(允許內容創作者直接從錄音的文字紀錄中編輯音訊和影片)和 PicnicHealth(一家處理醫療紀錄的新創公司)。斯里瓦斯塔瓦說,Baseten 的客戶發現,隨著他們自己產品的需求快速增長,他們需要更多的人工智慧處理能力。

「對於一位客戶,我們在六個月前將他們的成本降低了約 60%,但在三個月內,他們的消耗量已經高於最初的消耗量,」他補充道。

Open AI、Google 和 Meta 等公司所有大型人工智慧實驗室仍在競相通過訓練功能更強大的人工智慧模型來超越彼此。無論成本如何,目標都是盡可能多地佔領仍處於萌芽狀態的人工智慧市場。

Fractional AI 執行長克里斯·泰勒說:「我認為前沿實驗室需要不斷投入大量資金以推動前沿發展,這是完全有可能的。」該公司總部位於舊金山,幫助其他軟體公司建構和整合客製化人工智慧。與 Baseten 和蓬勃發展的人工智慧生態系統中的許多其他公司一樣,他的公司依靠這些尖端模型為其客戶提供成果。

創投和 Theory Ventures 創辦人湯瑪斯·童古茲表示,在未來幾年內,新的創新和更多人工智慧專用微晶片可能意味著向最終客戶交付人工智慧的系統比現在高效一千倍。他補充說,投資者和大型科技公司正在押注,由於推理模型和快速採用,未來十年人工智慧模型的需求量可能會增加一兆倍或更多。

童古茲說:「你鍵盤上的每一次按鍵,或你對著麥克風發出的每一個音素,都將由至少一個人工智慧轉錄或操作。」他補充說,如果是這樣,人工智慧市場很快就會比現在大 1000 倍。

NetEase
作者

網易科技,有態度的科技門戶!關注微信公眾號(tech_163),看有態度的深度內容。

使用 Facebook 留言
發表回應
謹慎發言,尊重彼此。按此展開留言規則