ADVERTISEMENT
GameNGen是一個有趣的概念驗證,展示了基於擴散模型的「遊戲引擎」。
Doom 的 E1M1 - The Hanger,這個象徵性的第一人稱射擊遊戲的第一關,經常被用來展示這款開源遊戲幾乎可以在任何你能想到的設備上運行。 下面的影片之所以新穎,不是因為它運行在什麼設備上,而是它如何運行。 你所看到的不是《毀滅戰士》(Doom)遊戲引擎,而是一個擴散模型,一種最常用於生成媒體的生成式人工智慧模型,它可以即時回應玩家的輸入。
ADVERTISEMENT
這就是「GameNGen」(發音為「遊戲引擎」),是來自 Google、DeepMind 和特拉維夫大學的研究人員的作品。 他們稱之為「第一個完全由神經模型驅動的遊戲引擎,可以在現有硬體上以高品質、長時間地實現與複雜環境的即時互動」。 簡單來說,它的工作原理是擴散模型在《毀滅戰士》的遊戲畫面片段上進行訓練,根據之前的畫面和玩家的輸入來產生下一格。
所有的生成式人工智慧模型本質上都是這樣工作的。 它們在大量的資料上進行訓練,以便預測下一個詞、影格或像素是什麼,進而自動生成所需的輸出。 GameNGen 令人印象深刻地將這種方法擴展到了一個基本功能齊全的即時互動電玩遊戲。目前,GameNGen 的運行速度約為每秒 20 格,這是非常慢的,特別是對於一個老遊戲來說,但它看起來確實像《毀滅戰士》。 根據 GameNGen 的論文,10 名人類評分員在觀看了 130 個隨機的遊戲片段後,讓他們分辨哪些是由 GameNGen 所產生的片段和哪些是「真實」的《毀滅戰士》遊戲片段,而結果大概只比隨機猜亂猜好一點點而已。 我想作為一個《毀滅戰士》專家,我應該可以分辨的出來,但這不是重點。
光靠看這段影片確實有點難以分辨,但如果你仔細看,你只會看到一個有點糟糕的《毀滅戰士》版本(有趣的是,我在影片中看到的唯一真正的「幻覺」是在玩家射擊敵人時出現的,這導致了一些模糊的回饋動畫),但研究人員和專案名稱所暗示的未來是,這項技術可能會發展到完全改變遊戲製作方式的地步。
ADVERTISEMENT
「今天,電子遊戲是由人類所編寫的。 GameNGen 是一個新範例的概念驗證,在這個範例中,遊戲是神經模型的權重,而不是一行一行的程式碼,」研究人員寫道。「GameNGen 表明,存在一種架構和模型權重,使得神經模型可以在現有硬體上有效地互動式執行一個複雜的遊戲(DOOM)。 雖然還有許多重要的問題需要解決,但我們希望這種範例能夠帶來重要的益處。 例如,在這種新範例下,電子遊戲的開發過程可能會成本更低、更容易上手,遊戲可以透過文字描述或示例圖片來開發和編輯。 這個願景的一小部分,即為現有遊戲創造修改或新的行為,可能會在短期內實現。」
未來是否可能所有的遊戲引擎都將只是不同的擴散模型?也許吧,我不知道。 正如研究人員指出的那樣,「仍然有許多重要問題」,
例如,如何在不依賴已有的《毀滅戰士》版本進行訓練的情況下製作一個擴散模型版本的《毀滅戰士》,或者像所有生成式 AI 的問題一樣,如何製作不直接來源於現有遊戲的遊戲,如果你這麼做了,是否只是在竊取所有提供訓練數據的遊戲開發者的創作成果?
ADVERTISEMENT
ADVERTISEMENT