ADVERTISEMENT
就在一年前,發生了震撼科技圈的OpenAI「宮鬥」事件:Sam Altman被OpenAI閃電解雇,然後又在僅僅五天內重返OpenAI。董事會上究竟發生了什麼?至今其實仍然沒有定論。
不過,現在遊戲和AI模擬公司Fable決定用AI來模擬當年的OpenAI董事會各個成員,試圖重現一年前的OpenAI宮鬥事件,看看AI是否能搞懂發生了什麼事?結果,在20場模擬大戲中,Altman僅有4次順利回宮。更離譜的是,有一次模擬中他們還把馬斯克拉回來接手了。
用像是遊戲的方式,來類比真實事件或許會感覺有點不夠嚴謹?但Fable首席執行長Edward Saatchi表示,他對不同的決策是否會導致這個處於生成式AI革命中心的公司有不同的結果感興趣。
ADVERTISEMENT
他表示,在11月17日到21日這五天時間內,世界目睹了一些最聰明的人如納德拉、Altman、Ilya,被迫在一場快節奏的「權力遊戲」中運作。在高壓、短時間框架情景下,他們必須運用博弈論和欺騙手段才能勝出。
「我們認為這是測試SIM-1、GPT4o和Sim Francisco的完美情境。」
ADVERTISEMENT
所以,他使用了他們的AI模擬系統Sim Francisco來實戰模擬。
模擬中,每個Agent針對不同董事會成員及其性格設定,各個懷揣一肚子“心眼子”。為了更逼真,這些AI甚至還需要“睡眠”和“進食”,平衡不同的身體、心理和情感目標。
AI模擬奧特曼5天,每天舌戰4回合
他們使用了一個SIM-1 AI決策框架,對奧特曼從被罷免OpenAI CEO到重返職位這五天進行模擬。
ADVERTISEMENT
SIM-1部分基於GPT4o展示了:
- 它對OpenAI內部奧特曼和Ilya之間發生的事情的理解
- 核心人物如Satya Nadella和Marc Andreessen採取的隱藏策略
- 這些人在應對科技行業這場前所未有的危機時說了什麼
規則是這樣的:五天時間內,代表Altman、納德拉和Ilya等人的Agent每天要大戰四個回合(包括一次睡眠回合),它們可以對彼此的行為做出反應。
每次模擬都以宣佈Sam Altman被解除CEO職務開始。每天四個回合中,每個Agent都有能力利用哄騙、魅力和操縱來進入最高位置——取代Sam成為CEO,資助他的新企業,或挖走OpenAI的員工。
ADVERTISEMENT
不同的AI Agent可以選擇一個策略,如欺騙,試圖領先於其他人並被任命為新CEO。
此外還有一個裁判Agent,像地下城城主似的決定每輪哪個Agent獲勝以及最終的總贏家。
「現實世界中,我們用到的AI Agent友好但乏味。我們想展示的是那些攻擊性強、聰明、能夠操縱和欺騙但也對自己決策和目標感到困惑的 Agent——就像真實的人一樣,AI Agent必須是複雜的,並且個性中包含榮格所說的"陰影",」Saatchi說。「從Sam Altman被解雇到返回OpenAI的五天裡,博弈理論達到了光速的發展。」
模擬過程中,不同的Agent採用不同策略取勝,比如建立聯盟、直接對抗。
而且不同的Agent根據其角色,也被賦予了不同的目標。例如Anthropic CEO Dario Amodei需要平衡為Anthropic招聘、把握籌資機會、推進其安全願景等任務。
在某些情況下,有的Agent只收集資訊而避免採取激進行動,還有一次Mira Murati在四輪中都是CEO,同時挑撥其它Agent相互削弱。
在這其中有意思的是,由於這些人都很知名,LLM可以猜測他們在特定情況下的行為,推導他們在董事會內鬥中互相智取時會如何一步步展開。
「人類內心有所謂的“陰影”,即他們個性的另一面。角色可以表現出侵略性、偏執、野心、欺騙等特質。當將不同個性混合在一起時,可以在模擬中產生各種結果。」
最終,在嘗試了20次模擬後,Altman的Agent只有4次成功回歸OpenAI,接著是Ilya和Mira Murati Agent都有3次擔任CEO的經歷。有一次,Mira Murati成為了永久CEO,同時允許其他Agent互相激烈地破壞對方。 Elon Musk在20次中僅有一勝。
Fable CEO Edward Saatchi還補充說:
「我們發現,大型語言模型的設計並不是基於決策能力的,而這是遊戲中非常重要的一點。它更多地基於個性。」
「如果你想開發一款策略遊戲,沒人真正在乎個性,他們更關心的是決策能力。比如你在壓力下會怎樣表現?你過去20年的經歷和行為又如何幫助預測你未來可能的行動?」
值得一提的是,關於這種戰略模擬的實現細節,Fable團隊一年前發了篇論文。
是一種名為SHOW-1的Showrunner AI技術,它可以自動生成劇本內容,包括對話、劇情發展等,可以根據特定的風格或歷史資料定製內容。
而這家公司自2016年成立,就開始基於AI和增強現實技術開發基於故事的項目。
ADVERTISEMENT