一位外國直播主,用ChatGPT給AI智慧體注入了自我意識。產生「生命」的蘿拉覺醒了,開始自己在《古墓奇兵》中闖關。如果遊戲角色被注入生命,電子遊戲會發展成什麼樣?曾經,這是不少人的暢想,而如今,隨著AI智慧體的發展,這種想像已經開始走入現實。
最近,一位YouTube作者Foxmaster製作了一個經典遊戲《古墓奇兵》的影片。
而其中的女主角蘿拉,居然是一個能控制自己角色的AI智慧體!
可以說,利用機器視覺、定位、物體識別、動畫、文字和語音等各種AI工具,Foxmaster為遊戲角色注入了數位生命。
所以,或許這就是電子遊戲的未來?
《古墓奇兵》女主有了意識
建構可以玩遊戲的虛擬AI,這個概念已經很常見。不過,Formaster想做的,是讓這個角色如同真人一樣。
因此,他選擇了《古墓奇兵》這款遊戲,遊戲主角蘿拉是一個人物性格鮮明、定義明確的角色。
而Formaste希望,這種個性會對遊戲的最終結局產生影響。
如何讓這個AI智慧體Lara Croft在遊戲中真正產生自我意識?
Formaster經過以下幾個步驟的探索,終於成功了。
如何讓蘿拉學習遊戲規則
首先第一步,叫她學會遊戲規則。《古墓奇兵》已經給出了教學,解釋了所有的遊戲控制過程。
作者讓Lara按照給出的方式去練習,像人類玩家一樣完成各個階段的教學。
教學在Lara離開泳池時結束,所以可以在那時重啟程式,做出改進。
開始時,改進Lara非常困難。
她有時會出現混亂,在地圖中隨意走動,甚至有時候會卡在選單欄中,一遍遍盯著她的指南針。
為瞭解決這個問題, 作者在一台虛擬機器上,重新調整了主時鐘,將遊戲處理程序加速了40倍。這個辦法起作用力,AI智慧體終於在相對不錯的時間內,完成了教學。
然而,還存在一個問題:Lara經常卡在一個位置,而且每個關卡都是由靜態元素組成,因此只有一條最佳化路徑。
這會導致她只知道不走哪些路徑,而不是想出更全面的方法來解題。但作者希望的是,Lara學會自己去發掘探險過程。
考慮到Lara唯一掌握的知識,僅僅是每道關卡顯示的螢幕上的內容,作者觀察了從未玩過遊戲的人類玩家的行為。
有的人會看完整個教學,有的人先會探索周圍的環境,而這些選擇的差異,就是由不同人的“個性”決定的。
而Lara需要學習的,恰恰就是這種態度。
識別角色
為了給AI建立與Lara的聯絡,就需要讓AI明白,她是一堆像素。人類玩家進入遊戲後,一下子有了這樣的意識。
對此,作者從各個角度,錄製了24個小時,Lara朝著不同方向活動的影片,以便AI智慧體能夠識別任何給定角色。
就像自動駕駛汽車一樣,能夠以每秒30幀速度拍攝24小時影片,得到2592000張參考圖像,以識別道路標誌。
首先,作者跟蹤頭部主要像素,然後是身體主要像素,來選擇相關區域。
為了確保Lara出現在每張圖像中,作者要求程式去識別那些不包含任何突出顯示的圖片。
當Lara佔據整個螢幕時,或當一個二維物體擋在她面前,作者使用AI視覺捕獲來幫助識別Lara,結果非常準確,足以識別螢幕上的角色。
學習如何與遊戲環境互動
能夠識別Lara後,需要讓AI與環境互動。
整個遊戲環境都是由同樣的區塊組成,作者將其匯入到立方體上,然後從各個角度捕獲環境,再運行識別過程,這樣AI智慧體就能識別出環境,就像人類玩家解釋圖像的過程。
紅色突出顯示的區域是,未能識別的紋理。但是,AI仍舊缺乏想去某個地方的意識,還需要知道自己距離周圍環境的距離。
有趣的是,這些未能識別的區域,通常是遠離Lara的位置,或被其他2D物體遮擋的位置。
當我們觀察人類玩家的行為,看到這張圖像後,我們能夠立即明白,箭頭所指向區域是一個入口。
我們可能不知道下一個房間的大小,但我們知道這是存在的。
但是,這也可能是一種視覺錯覺。當我們去移動,入口區域的紋理與其他地方不同,這是3D空間的特徵。
因此,AI智慧體還得學會移動,並進行比較。從計算角度來看,可以使用多個圖像來確定哪些紋理尺寸的變化最小。
這裡可以使用主多邊形的面積來算,它們的變化主要基於彼此之間距離成比例的機率。
讓AI決定下一步要去哪裡
現在,AI已經知道自己身在何處了,她必須做出決定,自己下一步要去哪裡。
通過識別紋理,可以讓她到達特定的位置,然而在關卡中導航,需要更簡單的東西。
最快的方法,就是簡化對比度,識別區域中光線的突然變化。但是,人類玩家不一定會去這些地方。
當有多個開口時,AI必須表現出足夠興趣,但不能導致她死亡。
比如,如果一個洞太深,就無法在不抓住周圍壁架的情況下跳下去。假如下面有水存在,倒是有可能值得這種冒險。
人類玩家知道什麼時候可以跳,但Lara的行動方針都是來源於教學,它必須精準估計自己和目標之間有多少個方塊,是否應該聚集自己的動量,以及在放手之前是否應該暫停一下。
總之,她必須像人類玩家一樣,做出精準評估。
如果她提前知道一個洞的大小,就會跑得非常快,這就並不符合我們的期望。
為了讓她多收集環境資訊,作者鼓勵AI,如果有疑惑,就應該旋轉相機,收集更多的資訊。
但真實情況下,即便如此,AI也可能卡在房間里。
為了鼓勵她走出房間,作者補充了一些收集規則。
比如,每次遇到在該區域成為優先順序前從未見過的紋理時,她都必須以增加螢幕上這種紋理大小的方式來移動。
這樣,她就只能在關卡中前進。因為每個關卡中都有獨特的紋理,解鎖的唯一方式,就是進入下一個關卡。
總之,Lara會不斷分析自己在螢幕上看到的內容-不同表面的紋理,她會移動自己的身體,定義新的興趣點(即目錄中尚未存在的紋理)。
在這個過程中,她會不斷驗證,去尋找丟失的紋理。
讓AI理解自己在遊戲中的運動能力
然而,即使經過了上述改進,這個AI還是太像個機器人了,行動模式是顯而易見的。
為了改進它,作者再次觀察了人類玩家。
是什麼決定了人類玩家在遊戲中如何行動?就是我們的記憶,我們會記住動作是如何組合的。
因此,這個過程也需要植入到AI中,因為Lara必須意識到她自己的運動能力。
為此,作者把AI每一秒的動作都保存起來,來訓練它,然後新增一條規則,允許它同時執行這些保存的動作。
這樣,AI的動作就變得平滑多了。
另外,因為每個動作的冷卻時間是已知的,就可以防止AI在執行不必要的動作時,仍然處於活動狀態。
在下圖中,火焰重新啟動的速度如此之快,需要完成很大的跳躍才能穿過。
幸運的是,這些通道在視覺上被簡化了,很容易識別塊的邊緣。
AI知道,Lara總是會在方塊的第一部分啟動時完成正確的跳躍,就像人類玩家理解的一樣。
ChatGPT注入人格
接下來,就需要將Lara的個性灌輸給AI智慧體。個性取決於經驗和記憶,這些因素的結合決定了Lara角色。
根據遊戲設定,她是一個著名的考古學家,從不畏懼冒險,願意接受分配的山區任務,甚至不要獎賞,完全出於熱愛。
另外,Lara還特別有錢,剛剛搬進一座豪宅,屋內裝飾非常優雅,屋子里還有一個訓練室。她還特別擅長教學,游泳,攀爬,耐力非常強。
當冒險途中遇到危險,她能夠保持鎮靜,而且非常勇敢,會毫不猶豫幫助同伴。
面對狼群包圍,她用槍精準地射殺,還能用匕首殺死凶險的狼。她唯一拒絕的是,主動強行開鎖。
以上的一切,都是從遊戲設定中,瞭解到的Lara個性。
接下來,就是以真實的方式去評論她所看到的一切,對此,作者在資料庫中已經編譯Lara的性格特徵。
為了使評論對實際情況有意義,程式需要將遊戲圖片與現實生活中可識別的東西相關聯。
對於紋理細節通常較少的圖片,可以通過Google圖片搜尋進行匹配。
因此,當AI智慧體檢測到足夠大的紋理,它就會啟動搜素。
為了識別單詞,作者將整個頁面複製到ChatGPT。然後要求ChatGPT根據出現的次數對其進行分類,再將識別出的單詞新增到列表中。
最後要求ChatGPT根據這些單詞建立一個句子,並且要考慮到Lara個性。這樣做,就是要ChatGPT去真是地評論,Lara在現實生活中看到的東西。
比如,如果紋理被識別為海獅,ChatGPT能夠將海獅與Lara個性特徵聯絡起來做出評論。
總得來說,Lara智慧體的人格是通過ChatGPT使用「勇敢」、「友好」或「聰明」等各種屬性設定。
Lara在遊戲中,感知和評論的所有物體都會通過這個人格過濾器,並由Lara根據既定的性格反應出來。
就比如上面的海豹,Lara會提及海獅化石,或者出色的游泳能力,並不會對其在馬戲團發表言論。
網友:AI智慧體讓電子遊戲變成了藝術品
有網友表示,這是讓角色自我發展最酷、最自然的感覺方式之一。當角色能夠活靈活現,你才可以真正體驗到電子遊戲是一件藝術品。
「她說話和分析周圍環境的方式非常可愛。讓AI機器人有能力評論周圍環境,無論它的實際水平如何,都會讓人覺得她是個活生生的人。」
「這太迷人了。她那超然的好奇心和一絲異想天開的想法,與我想像中的Lara的內心獨白驚人地相似。」
有人說:「讓我感到驚奇的是,她的對話與她的行為相吻合。這讓人覺得,寫對話的人工智慧和控制角色的人工智慧是同一個人。」
前不久在史丹佛AI智慧體小鎮開源時,網友們就十分激動,覺得AGI已來,各種RPG和模擬類遊戲都會很快用上這種技術。
而現在,Foxmaster將ChatGPT、電腦視覺和物體識別的結合,讓電子遊戲變得更有趣了。
或許在未來,電子遊戲角色可以被賦予更深、更靈活的個性,對環境做出更快的反應,以及許多我們無法想像的變化。
請注意!留言要自負法律責任,相關案例層出不窮,請慎重發文!