AI玩10個月等於人類訓練4.5萬年,DOTA 2 人機大戰以人類慘敗告終

AI玩10個月等於人類訓練4.5萬年,DOTA  2 人機大戰以人類慘敗告終

昨天,OpenAIFive在《Dota 2》中以2:0擊敗了世界冠軍團隊OG,再次顯示出了AI的強大威力,也正式宣告人類在《Dota》這種高難度遊戲中成為AI的手下敗將。

OpenAI Five在《Dota 2》中以2:0擊敗了世界冠軍團隊,人機大戰人類最終不敵AI。OpenAI Five在去年輸掉比賽後進行了最佳化,訓練時間相當於人類玩了4.5萬年。

  OpenAI 可以宣佈自己是世界第一了。

昨天凌晨,OpenAI Five在《Dota 2》中以2:0擊敗了世界冠軍團隊OG,再次顯示出了AI的強大威力,也正式宣告人類在Dota這種高難度遊戲中成為AI的手下敗將。

這次比賽,OpenAI Five的表現出是迄今為止展示出的最高水準:人類對手去年贏得了世界上最令人垂涎的電子競技賽事 TI8 的冠軍;OpenAI Five 在去年輸掉比賽後進行了最佳化,訓練時間相當於人類玩了4.5萬年,贏得比賽也並不出乎意料。

AI玩10個月等於人類訓練4.5萬年,DOTA  2 人機大戰以人類慘敗告終

2:0,AI戰勝人類

在這場人機大戰中,每隊只有17個英雄可供選擇。OpenAI 還選擇了所謂的「Captain'sDraft」遊戲模式。與之前的比賽一樣,OpenAI 也禁用了召喚和幻覺功能,這兩項功能都涉及以英雄副本的形式引入其他變量,以及OpenAI 訓練系統時未考慮的一些特殊因素和單位。

除此之外,這場比賽與正常的《Dota 2》比賽一樣,其最終目標是摧毀敵方隊伍的「基地」,即每個團隊領土末端的大型塔樓,在敵人的隊伍成功摧毀其他小型塔後,基地是很脆弱的,整個比賽過程的中心是對塔的攻防,以及英雄與英雄之間的團戰。

在第一場比賽中,OpenAI Five 讓對手OG大吃一驚,透過一系列激進戰術獲得了勝利,其中包括對遊戲中獲取的金幣的花費方式,在本方英雄死亡時立即課金復活,即使在比賽初期也是如此。

AI玩10個月等於人類訓練4.5萬年,DOTA  2 人機大戰以人類慘敗告終

對此,OpenAI 首席技術長Greg Brockman指出,OpenAI 喜歡有利於短期收益的戰略,說明在長期規劃上不如人類,而且《Dota 2》這種遊戲通常要依賴於長期規劃才能獲勝。然而,在這場比賽中,這種早期就課金復活的策略得到了回報,OpenAI Five獲得了優勢,當比賽拖入30分鐘時,OG頂不住了。

在第二場比賽中,OpenAI 表現更好,在最初的幾分鐘內即獲得了對OG的先期優勢,然後無情碾壓了人類玩家,在第一場比賽時間剛剛過半的時間點上即取得勝利。

值得注意的是,OpenAI Five在第二場比賽中開始玩得異常激進,以及 OG 在 AI 全圖範圍內的推進時有些無力對抗。OpenAI Five能夠利用其特定的英雄選擇帶來的優勢。

飛速進化的OpenAI Five:已經訓練4.5萬年

去年8月,OpenAI Five曾以3:2擊敗半職業人類玩家,不過當面對職業對手時,OpenAI 便輸給了paiNGaming戰隊。

根據OpenAI 聯合創始人兼主席Greg Brockman(也是該組織的CTO)的說法,在輸掉比賽之後,OpenAI Five是透過在加速的虛擬環境中進行自我改進而變得更加強大的。

OpenAI Five由深度強化學習提供支持,也就是說它的編碼目的不是「如何遊戲」,而是「如何學習」。Brockman在比賽開始前表示。AI在10個月中,已經玩了45,000年的《Dota 2》遊戲,而且,玩了這麼長時間也沒有覺得無聊。

這場比賽採用三戰兩勝制,所有bot都使用相同的深度強化學習技術進行訓練,並由同一OpenAI 系統的不同層獨立控制。

  OpenAI 向公眾開放與AI對決,終極目標是實現通用人工智慧

對於OpenAI 來說,值得慶祝的不僅僅是這次勝利,還因為其證明了對強化學習的態度及其關於AI的普適哲學樹立的里程碑。

研究團隊將不再公開展示其AI遊戲bot,而是致力於開發軟體,讓人類與OpenAI Five軟體即時協作,與機器人一起玩遊戲,並學習他們獨特的前所未有的戰略和行為。

OpenAI Five還發佈了一個平台,供公眾與OpenAI Five對戰,這種模式稱為「競技場」模式,將於4月18日起開放三天。OpenAI 表示,協作軟體可能永遠不會向公眾開放,不過大家可以在活動中親自嘗試一下。

OpenAI 的聯合創始人兼首席執行長SamAltman還表示,此類工作證明了與AI智慧體的合作可能會在未來帶來巨大的利益。

Altman說:「對於世界如何運作,如何訓練這些智慧體,令其實現協作上,這次活動是重要的一課。實現人類與AI的合作,是我們對未來世界更積極的願景之一,人工智慧與人類共同努力,使人類變得更好、更有趣、更有影響力。」

OpenAI 可能會繼續涉足《Dota 2》和其他視頻遊戲,主要是因為這些遊戲是人工智慧的良好測試平台,也是衡量AI技術進步的良好基準測試工具。

現在可能還沒有一個遊戲像OpenAI Five這樣,AI系統最終無法具備超出人類能力的水準。對於更廣泛的AI行業而言,精通視頻遊戲可能很快就會變得過時,我們需要簡單的方式來證明AI系統可以快速學習,並能夠更快速高效地的解決現實世界的困難任務,獲得更有意義的好處。

最終,OpenAI 希望將其《Dota 2》學習並擴展到遊戲之外的新領域,並最終擴展到現實世界中。為此,OpenAI 正致力於使用強化學習和其他技術,為機器人手提供更靈巧、更精細、更人性化的動作。

「OpenAI 正在努力的方向建立通用人工智慧(AGI),並與世界分享這些好處,同時確保其安全性。」Altman說的是建立一個能夠執行任何人類任務的多功能AI系統。「我們的目標不是戰勝電子遊戲,雖然這很有趣。我們的目標是揭開實現AGI道路上的祕密。」

NetEase
作者

網易科技,有態度的科技門戶!關注微信公眾號(tech_163),看有態度的深度內容。

使用 Facebook 留言
發表回應
謹慎發言,尊重彼此。按此展開留言規則