日本團隊使用富岳超級電腦開發AI語言模型Fugaku-LLM,訓練資料大多為日語內容,能回答俳句問題

日本團隊使用富岳超級電腦開發AI語言模型Fugaku-LLM,訓練資料大多為日語內容,能回答俳句問題

ADVERTISEMENT

一個由東京工業大學、富士通和其他機構組成的研究團隊宣布,他們利用日本超級電腦富岳(Fugaku),開發出可作為生成式人工智慧基礎的大型語言模型。

該模型名為 Fugaku-LLM,其訓練資料中 60% 為日語內容,目的是在為日本國內量身定制生成式人工智慧研究奠定基礎。該專案於 2023 年 5 月啟動,由上述機構以及東北大學、名古屋大學、理化學研究所 (RIKEN)、網路代理商 (CyberAgent) 和Kotoba Technologies的研究人員共同參與,並使用富士通和理化學研究所共同開發的超級電腦進行訓練。 

日本團隊使用富岳超級電腦開發AI語言模型Fugaku-LLM,訓練資料大多為日語內容,能回答俳句問題

研究人員表示,Fugaku-LLM 能夠流暢回答有關俳句大師松尾芭蕉詩歌的問題,展現出其出色的日語理解能力。 

與其他具備日語能力的模型不同,Fugaku-LLM 並非採用持續學習的方式,而是從頭開始使用團隊自有資料進行訓練,且這些資料不包含有害資訊,因此整個學習過程都可以被理解,透明度和安全性也更強。 

另一個重要之處在於,該團隊成功地使用中央處理器 (CPU) 而不是圖形處理器 (GPU) 來訓練 Fugaku-LLM 大型語言模型。在語言模型訓練中,通常使用 GPU,但由於全球各國都在激烈競爭開發語言模型,GPU 目前供不應求。 

研究人員表示,他們是透過最佳化富岳的通訊性能來提升其運算能力。 

東京工業大學教授橫田理夫 (Rio Yokota) 在新聞發表會上表示:「我們證明了自己有能力克服富岳帶來的挑戰。我們完全沒有依賴外國產品,這是一個巨大的成就。」 

Fugaku-LLM 的原始碼已經公開,可以在富士通的網站上取得。

netizen
作者

一個老派的科技媒體工作者,對於最新科技動態、最新科技訊息的觀察報告。

使用 Facebook 留言
發表回應
謹慎發言,尊重彼此。按此展開留言規則