據媒體援引知情人士透露,生成式AI領頭羊OpenAI正開發新的AI大型語言模型計畫----「草莓 」(Strawberry),而這個「草莓」非常神秘,很可能與提升AI大型語言模型的推理能力有關。
OpenAI的神秘計畫「草莓」是什麼?據媒體報導,5月份OpenAI的一份內部檔案顯示,OpenAI的內部團隊正開發的「草莓」,目的是增強OpenAI的模型的推理能力,處理複雜科學和數學問題的能力,讓大型語言模型不僅能生成查詢答案,還能提前規劃,以便自主、可靠地瀏覽Internet,進行OpenAI 定義的深度研究。
按照十幾位人工智慧研究人員的說法,這是目前大型語言模型還沒能實現的功能。
很明顯,OpenAI現階段還不想公佈關於「草莓」的詳細資料。當被問及「草莓」的細節時,OpenAI的一位發言人只是繞了個彎表示:「我們希望AI大型語言模型能像人類那樣看待和理解這個世界。不斷研究新的AI能力是業界的普遍做法,畢竟我們都相信AI的推理能力會隨著時間的推移而不斷提高。」
畢竟即便在 OpenAI 內部,「草莓」的工作原理也是嚴格保密的,目前仍沒有發佈時間消息。
但有媒體透露,「草莓」的前身是Q*演算法模型,Q*能夠解決棘手的科學和數學問題。而數學是生成式AI發展的基礎,如果AI模型掌握了數學能力,將擁有更強的推理能力,甚至與人類智慧相媲美。而這一點也是目前的大型語言模型還無法做到的。
去年底Q*在OpenAI的內部信中首次曝光,而CEO阿特曼當時被開除也是因為這個Q*計畫。
一些OpenAI內部人士指出,Q*可能是 OpenAI 在追尋通用人工智慧(AGI)路上的一項突破,其發展速度之快讓人感到震驚,並擔心AI過快發展可能會威脅到人類安全。在這種擔憂蔓延之際,奧特曼在沒有告知董事會的情況下,選擇加速推進GPT系列模型的開發及商業化,這激發了OpenAI董事會的不滿並選擇把他踢出局。
利用「草莓」提高大型語言模型的推理能力
雖然無法獲取「草莓」的詳細情況,但從OpenAI近期的種種蛛絲馬跡中可以發現,增強生成式AI大型語言模型的推理能力,是它接下來的發展重心。
OpenAI的CEO阿特曼曾強調,今後AI發展的關鍵將圍繞推理能力展開。
在本週二的一次內部全員會議上,OpenAI展示了一個研究項目的展示,稱該項目擁有類似人類的推理能力。OpenAI發言人向媒體證實了這次內部會議,但拒絕透露會議細節,因此無法確定展示的項目是否為「草莓」。
但據知情人士透露,「草莓」包括一種專門的「後訓練」方法,即生成式AI模型已經過大量資料集上進行預訓練後,進一步調整模型以提高其在特定任務上的表現。這類似於史丹佛大學在2022年開發的“自學推理者”(Self-Taught Reasoner,簡稱STaR)方法。
STaR的創造者之一、史丹佛大學教授Noah Goodman曾表示,STaR可以讓AI模型通過反覆建立自己的訓練資料,“引導 ”自己進入更高的智慧水平,理論上可以用來讓語言模型實現超越人類的智慧。
這就和OpenAI想要的推理能力對上了。而且,OpenAI在11日還公佈了未來AI發展的五級路線圖:
按照OpenAI的猜想,未來AI會經歷5個階段:
第一級:聊天機器人,具有對話語言的人工智慧
第二級:推理者,人類水平的問題解決
第三級:代理者,可以採取行動的系統
第四級:創新者、可協助發明的人工智慧
第五級:組織者,可以完成組織工作的人工智慧
按照目前蒐集的資訊,「草莓」極可能是幫助OpenAI實現第二級AI的關鍵。
據媒體報導,一位OpenAI高層表示,目前AI模型正處第一等級,但預計很快將達到第二等級,即推理者。OpenAI目前正在致力於在特定任務上實現博士等級的智慧,預計可能在一年或一年半內實現。
另一項OpenAI聚焦的功能是,提高大型語言模型執行長時間任務(Long-Horizon Tasks,簡稱LHT)的能力,這指的是需要模型提前規劃,並在較長一段時間內執行一系列任務。
據知情人士透露,為了實現這一目標,OpenAI希望「草莓」能成為建立、訓練和評估深度研究的模型,並利用“電腦使用代理”(Computer-Using Agent,簡稱CUA)來自主瀏覽網頁,並根據其發現自主採取行動。
如果OpenAI成功了,「草莓」很可能會重新定義AI的能力,使其能夠進行重大科學發現、開發新的軟體應用程式,並自主執行複雜任務,那人類離AGI又進一步了。
- 延伸閱讀:馬斯克認為AI有望在明年超越最聰明的人類,通用人工智慧AGI近期最大的阻礙是電力
- 延伸閱讀:通用人工智慧AGI何時成真?Altman、黃仁勳預測時間點都相同,但馬斯克斷言「電不夠」什麼都別談
- 延伸閱讀:Meta首席AI科學家炮轟OpenAI已淪為微軟的「附屬特約研究機構」:他們不會是第一個開發出AGI的人
請注意!留言要自負法律責任,相關案例層出不窮,請慎重發文!