研究發現AI語言模型 GPT-3,在智商測試明顯勝過一般大學生

研究發現AI語言模型 GPT-3,在智商測試明顯勝過一般大學生

ADVERTISEMENT

在訓練了 2000 億個單詞、燒掉幾千萬美元後,史上最強大 AI 模型「生成型已訓練變換模型 3」(GPT-3)一炮而紅。

這個 OpenAI 打造的語言 AI 模型宛如萬能選手,只有你想不到的畫風,沒有它輸不出的文案,既能創作文學,能當翻譯,還能編寫自己的電腦程式碼。任何外行人都可以使用這一模型,幾分鐘內提供示例,就能獲得想要的文字產出。

美國加利福尼亞大學洛杉磯分校的研究人員發現,在衡量智力的一系列推理測試中,自回歸語言模型 GPT-3 的成績明顯優於普通大學生。

研究發現AI語言模型 GPT-3,在智商測試明顯勝過一般大學生

該程式利用深度學習產生類似人類語言的文字。GPT-3 有很多用途,包括語言翻譯和為聊天機器人生成文字等,其有 1750 億個參數,是目前規模最大、功能最強的語言處理人工智慧模型之一。

OpenAI 的 ChatGPT 似乎也實現了類似效果,雖然它依然基於 GGPT-3,但這一模型被業內稱為「GPT-4」 ,這也是矽谷研究實驗室推出的第四代語言模型,對全世界的搜尋引擎、作家、編碼人員、教授以及 Nickelback 構成了生存威脅。

當然,根據大多數專家的意見,與即將發表的 GPT-4 主版本相比,ChatGPT 現版本只能說是一個開胃小菜。

研究發現AI語言模型 GPT-3,在智商測試明顯勝過一般大學生

加州大學研究者認為,這類大型語言模型重新引發了關於在提供足夠訓練資料的情況下人類認知能力是否更強的爭論。特別令人感興趣的是這些模型能夠零樣本地推理新問題,而無需對這些問題進行任何直接訓練。

研究人員指出,在人類認知中,這種能力與模擬推理能力密切相關,而他們在一系列模擬任務上對 GPT-3 進行了直接比較,包括與 Raven 的漸進矩陣密切相關的新型基於文字的矩陣推理任務,最終發現 GPT-3 表現出了驚人的抽象模式歸納能力,在大多數情況下匹配甚至超越人類的能力。

最終結果表明,諸如 GPT-3 之類的大型語言模型已經獲得了一種「新興能力」,可以為廣泛的模擬問題找到零樣本解決方案。

IFENG
作者

鳳凰網(科技),集綜合資訊、視訊分發、原創內容製作、網路廣播、網路直播、媒體電商等多領域於一身,並於2011年在紐交所上市(紐交所代碼:FENG),成為全球首個從傳統媒體分拆上市的新媒體公司。

使用 Facebook 留言
發表回應
謹慎發言,尊重彼此。按此展開留言規則