OpenAI新的大語言模型計畫「草莓」曝光,又有神秘黑科技要來?

OpenAI新的大語言模型計畫「草莓」曝光,又有神秘黑科技要來?

據媒體援引知情人士透露,生成式AI領頭羊OpenAI正開發新的AI大型語言模型計畫----「草莓 」(Strawberry),而這個「草莓」非常神秘,很可能與提升AI大型語言模型的推理能力有關。

OpenAI的神秘計畫「草莓」是什麼?據媒體報導,5月份OpenAI的一份內部檔案顯示,OpenAI的內部團隊正開發的「草莓」,目的是增強OpenAI的模型的推理能力,處理複雜科學和數學問題的能力,讓大型語言模型不僅能生成查詢答案,還能提前規劃,以便自主、可靠地瀏覽Internet,進行OpenAI 定義的深度研究。

按照十幾位人工智慧研究人員的說法,這是目前大型語言模型還沒能實現的功能。

很明顯,OpenAI現階段還不想公佈關於「草莓」的詳細資料。當被問及「草莓」的細節時,OpenAI的一位發言人只是繞了個彎表示:「我們希望AI大型語言模型能像人類那樣看待和理解這個世界。不斷研究新的AI能力是業界的普遍做法,畢竟我們都相信AI的推理能力會隨著時間的推移而不斷提高。」

畢竟即便在 OpenAI 內部,「草莓」的工作原理也是嚴格保密的,目前仍沒有發佈時間消息。

但有媒體透露,「草莓」的前身是Q*演算法模型,Q*能夠解決棘手的科學和數學問題。而數學是生成式AI發展的基礎,如果AI模型掌握了數學能力,將擁有更強的推理能力,甚至與人類智慧相媲美。而這一點也是目前的大型語言模型還無法做到的。

去年底Q*在OpenAI的內部信中首次曝光,而CEO阿特曼當時被開除也是因為這個Q*計畫。

一些OpenAI內部人士指出,Q*可能是 OpenAI 在追尋通用人工智慧(AGI)路上的一項突破,其發展速度之快讓人感到震驚,並擔心AI過快發展可能會威脅到人類安全。在這種擔憂蔓延之際,奧特曼在沒有告知董事會的情況下,選擇加速推進GPT系列模型的開發及商業化,這激發了OpenAI董事會的不滿並選擇把他踢出局。

利用「草莓」提高大型語言模型的推理能力

雖然無法獲取「草莓」的詳細情況,但從OpenAI近期的種種蛛絲馬跡中可以發現,增強生成式AI大型語言模型的推理能力,是它接下來的發展重心。

OpenAI的CEO阿特曼曾強調,今後AI發展的關鍵將圍繞推理能力展開。

在本週二的一次內部全員會議上,OpenAI展示了一個研究項目的展示,稱該項目擁有類似人類的推理能力。OpenAI發言人向媒體證實了這次內部會議,但拒絕透露會議細節,因此無法確定展示的項目是否為「草莓」。

但據知情人士透露,「草莓」包括一種專門的「後訓練」方法,即生成式AI模型已經過大量資料集上進行預訓練後,進一步調整模型以提高其在特定任務上的表現。這類似於史丹佛大學在2022年開發的“自學推理者”(Self-Taught Reasoner,簡稱STaR)方法。

STaR的創造者之一、史丹佛大學教授Noah Goodman曾表示,STaR可以讓AI模型通過反覆建立自己的訓練資料,“引導 ”自己進入更高的智慧水平,理論上可以用來讓語言模型實現超越人類的智慧。

這就和OpenAI想要的推理能力對上了。而且,OpenAI在11日還公佈了未來AI發展的五級路線圖:

OpenAI新的大語言模型計畫「草莓」曝光,又有神秘黑科技要來?

按照OpenAI的猜想,未來AI會經歷5個階段:

第一級:聊天機器人,具有對話語言的人工智慧

第二級:推理者,人類水平的問題解決

第三級:代理者,可以採取行動的系統

第四級:創新者、可協助發明的人工智慧

第五級:組織者,可以完成組織工作的人工智慧

按照目前蒐集的資訊,「草莓」極可能是幫助OpenAI實現第二級AI的關鍵。

據媒體報導,一位OpenAI高層表示,目前AI模型正處第一等級,但預計很快將達到第二等級,即推理者。OpenAI目前正在致力於在特定任務上實現博士等級的智慧,預計可能在一年或一年半內實現。

另一項OpenAI聚焦的功能是,提高大型語言模型執行長時間任務(Long-Horizon Tasks,簡稱LHT)的能力,這指的是需要模型提前規劃,並在較長一段時間內執行一系列任務。

據知情人士透露,為了實現這一目標,OpenAI希望「草莓」能成為建立、訓練和評估深度研究的模型,並利用“電腦使用代理”(Computer-Using Agent,簡稱CUA)來自主瀏覽網頁,並根據其發現自主採取行動。

如果OpenAI成功了,「草莓」很可能會重新定義AI的能力,使其能夠進行重大科學發現、開發新的軟體應用程式,並自主執行複雜任務,那人類離AGI又進一步了。

 

 

 

NetEase
作者

網易科技,有態度的科技門戶!關注微信公眾號(tech_163),看有態度的深度內容。

使用 Facebook 留言
發表回應
謹慎發言,尊重彼此。按此展開留言規則