2023.11.20 10:30

Google DeepMind創始人提出通用人工智慧分級框架:ChatGPT還只能算是初級

ADVERTISEMENT

Google DeepMind聯合創始人肖恩·萊格(Shane Legg)帶領的DeepMind研究團隊發佈論文(Levels of AGI: Operationalizing Progress on the Path to AGI),提出了對通用人工智慧(AGI)的更清晰定義,制定了類似於自動駕駛L1-L5等級的AGI分級分類框架。

長期以來,AGI都是一個含義模糊的概念,粗略可以將其理解為「和人類差不多聰明」。研究團隊在論文中寫道,「我們希望提供一個共通的語言,用於比較模型、評估風險,以及衡量我們在通往AGI的道路上行進到了什麼階段。」

ADVERTISEMENT

AGI六大定義原則

研究團隊沒有用一句話概括AGI,而是提出,任何對AGI的定義都應滿足六條原則:

關注能力,而非過程

也就是說關注AGI可以完成什麼,而不是完成任務的機制。這種將關注焦點放在能力上的方式,使我們能夠將一些內容排除在對AGI的要求之外,比如實現AGI並不意味著智慧體以類似人類的方式思考或理解,或實現AGI並不意味著智慧體具備意識或感知(具有情感的能力),因為這些特質不僅側重於過程,而且目前無法透過公認的科學方法來衡量。

關注通用性和性能

研究團隊認為,通用性和性能是AGI的關鍵組成部分。

ADVERTISEMENT

關注認知和元認知任務

大多數對AGI的定義側重於認知任務,可以理解為非物理任務。儘管目前機器人技術取得了一些進展,但與非物理能力相比,AI系統的物理能力似乎滯後了。執行物理任務的能力確實增加了智慧體的通用性,但我們認為這不應被視為實現AGI必要的先決條件。另一方面,元認知能力(例如學習新任務的能力或知道何時向人類請求澄清或協助的能力)是智慧體實現通用性的關鍵先決條件。

關注潛力,而非部署

證明系統能夠以一定性能水平執行一組必要任務,應該足以宣佈該系統為AGI,在現實世界部署這樣的系統,不應該成為AGI定義的固有要求。

關注生態效度

我們希望強調,選擇與人們在現實世界(即生態有效)所重視的任務相一致的任務非常重要。

ADVERTISEMENT

關注通往AGI的路徑,而不是單一的終點。研究團隊提出AGI的五級分類,每個AGI等級都與一組明確的度量/基準相關聯,以及每個等級都引入已識別的風險和人機互動範式的變化,比如OpenAI提出的勞動替代定義就更符合「大師AGI」。

AGI五級分類

基於能力深度(性能)和廣度(通用性),該研究將AGI分類為:非AI、初級、中級、專家、大師、超級智慧。單個系統可能橫跨分類法中的不同等級,截至2023年9月,前沿語言模型如OpenAI的ChatGPT、Google的Bard、Meta的Llama 2在某些任務上(如短篇論文寫作、簡單編碼)表現出能力嫻熟的「中級」性能水平,但在大多數任務上(如數學能力、涉及事實性的任務)仍處於「初級」。

ADVERTISEMENT

研究團隊認為,總的來說,當前的前沿語言模型會被視為第1級通用AI,即「初級AGI」,直到其性能水平在更廣泛的任務集上提高,滿足第2級通用AI(能力嫻熟AGI)的標準。

同時,研究團隊提醒道,獲得特定認知領域的更強技能,可能對AI安全產生嚴重影響,如在掌握強大的倫理推理技能之前獲得強大的化學工程知識,可能是一種危險的組合。還要注意,性能或通用性等級之間的進展速度可能是非線性的。獲得學習新技能的能力可能會加速通往下一個等級的處理程序。

在性能和通用性的綜合方面,分級中的最高等級是ASI(人工超級智慧)。研究團隊將「超級智慧」性能定義為超過100%的人類。例如,研究團隊假定AlphaFold是分類法中的第5級「限定領域超人AI」,因為它在一個任務(從氨基酸序列預測蛋白質的三維結構)上的表現高於全球頂級科學家的水平。這個定義意味著第5級通用AI(ASI)系統將能夠以沒有人類能夠匹敵的水平執行各種任務。

此外,這個框架還意味著這樣的「超人系統」可能能夠執行比AGI低等級更廣泛的任務,可以理解為其能夠實現原本人類完全不可能執行的任務。ASI可能具有的非人類技能可能包括神經介面(透過分析大腦訊號來解碼思想的機制)、神諭能力(透過分析大量資料來做出高品質預測的機制),以及與動物交流的能力(透過分析它們的聲音、腦電波或肢體語言的模式等機制)。

10月底,萊格在接受科技播客採訪時表示,他仍然堅持2011年就曾公開發表的觀點——研究人員有50%的可能在2028年實現AGI。那麼這具體指的是哪一個等級?目前他還沒有明確的闡釋。

 

ADVERTISEMENT