2024.01.31 13:00

德國新創公司突破傳統電晶體限制,利用「記憶電容器」提升AI晶片效能,降低20倍的能源消耗

ADVERTISEMENT

一家德國新創公司 Semron 正在開發一種名為「3D堆疊」的晶片,以便直接在智慧型手機、耳機、VR 頭戴式裝置和其他行動設備上運行人工智慧模型。 

由德累斯頓工業大學工程系畢業生 Kai-Uwe Demasius 和 Aron Kirschen 共同創立的 Semron 晶片使用電場而非傳統處理器的電流來進行運算,Kirschen 聲稱此舉可提高能源效率並降低生產成本。 

Kirschen 在接受採訪時表示:「由於預期人AI算資源將出現短缺,許多依賴於這些能力的商業模式的公司面臨著生存風險——例如,那些訓練自己模型的大型初創公司。我我們技術的獨特功能將使我們能夠達到當今消費電子設備晶片的價格點,儘管我們的晶片能夠運行先進的AI,而其他公司則不能。」 

ADVERTISEMENT

Semron 的晶片使用一種稱為「記憶電容器」的特殊元件進行運算,Demasius 和 Kirschen 在 2016 年(成立 Semron 四年前)就為此提交了初步專利。大多數電腦晶片都是由電晶體製成,與電容器不同,電晶體無法儲存能量,它們只是充當「開/關」開關,控制電流的通過與否。 

Semron 的記憶電容器由傳統半導體材料製成,利用化學中稱為電荷遮罩的原理工作。記憶電容器透過一個「遮罩層」控制頂部電極和底部電極之間的電場。遮罩層反過來由晶片的記憶體控制,該記憶體可以儲存人工智慧模型的不同「權重」。(權重基本上充當模型中的旋鈕,在模型訓練和處理數據時控制和微調其性能。) 

電場方法將晶片等級的電子移動降到最低,進而降低了能量消耗和熱量。Semron 旨在利用電場的散熱特性將多達數百層的記憶電容器放置在單個晶片上,大大提高運算能力。 

ADVERTISEMENT

Kirschen 補充道:「我們利用這個特性作為一個平臺,在固定矽面積上部署數百倍的運算資源。你可以想像它就像就像一個封裝中有數百個晶片一樣。」 

在 2021 年發表於《自然電子期刊》的一項研究中,Semron 和馬克斯普朗克微結構物理研究所的研究人員成功訓練了一個電腦視覺模型,其能源效率超過 3,500 TOPS/W,是現有技術的 35 到 300 倍。TOPS/W 是一個有點模糊的指標,但結論是記憶電容器可以大大降低人工智慧模型訓練時的能量消耗。 

ADVERTISEMENT

目前,Kirschen 表示 Semron 仍處於「產品前」階段,並且幾乎沒有收入。通常,晶片新創公司最困難的部分是大規模製造和獲得有意義的客戶群,儘管不一定按此順序。 

對Semron來說更加困難的是,它在像 Kneron、EnCharge 和 Tenstorrent 這樣的客製晶片企業中面臨著激烈的競爭,這些公司總共籌集了數千萬美元的風險資本。與 Semron 一樣,EnCharge 也在設計使用電容器而非電晶體的電腦晶片,但使用不同的基板架構。 

然而,擁有 11 人團隊的 Semron 計畫到今年年底將團隊擴大到大約 25 人,已成功吸引來自 Join Capital、SquareOne、OTB Ventures 和 Onsight Ventures 等投資者的資金。迄今為止,這家新創公司已籌集到 1000 萬歐元(約 1081 萬美元)。 

ADVERTISEMENT

SquareOne 合夥人 Georg Stockinger 透過電子郵件表示: 

「運算資源將成為 21 世紀的『石油』。隨著大型語言模型佔據世界,摩爾定律接近物理極限,未來幾年運算資源將會出現巨大瓶頸。缺乏對運算基礎設施的存取將大大降低公司和整個國家的生產力和競爭力。Semron 將透過提供一種專門用於運算人工智慧模型的革命性新晶片來解決這一問題,成為解決方案的關鍵要素。它打破了傳統基於電晶體的運算典範,並將特定運算任務的成本和能源消耗降低至少 20 倍。」

ADVERTISEMENT