AI玩10個月等於人類訓練4.5萬年，DOTA 2 人機大戰以人類慘敗告終

昨天，OpenAIFive在《Dota 2》中以2:0擊敗了世界冠軍團隊OG，再次顯示出了AI的強大威力，也正式宣告人類在《Dota》這種高難度遊戲中成為AI的手下敗將。

OpenAI Five在《Dota 2》中以2:0擊敗了世界冠軍團隊，人機大戰人類最終不敵AI。OpenAI Five在去年輸掉比賽後進行了最佳化，訓練時間相當於人類玩了4.5萬年。

　　OpenAI 可以宣佈自己是世界第一了。

昨天凌晨，OpenAI Five在《Dota 2》中以2:0擊敗了世界冠軍團隊OG，再次顯示出了AI的強大威力，也正式宣告人類在Dota這種高難度遊戲中成為AI的手下敗將。

這次比賽，OpenAI Five的表現出是迄今為止展示出的最高水準：人類對手去年贏得了世界上最令人垂涎的電子競技賽事 TI8 的冠軍；OpenAI Five 在去年輸掉比賽後進行了最佳化，訓練時間相當於人類玩了4.5萬年，贏得比賽也並不出乎意料。

▲ 人類對手OG團隊

2:0，AI戰勝人類

在這場人機大戰中，每隊只有17個英雄可供選擇。OpenAI 還選擇了所謂的「Captain'sDraft」遊戲模式。與之前的比賽一樣，OpenAI 也禁用了召喚和幻覺功能，這兩項功能都涉及以英雄副本的形式引入其他變量，以及OpenAI 訓練系統時未考慮的一些特殊因素和單位。

除此之外，這場比賽與正常的《Dota 2》比賽一樣，其最終目標是摧毀敵方隊伍的「基地」，即每個團隊領土末端的大型塔樓，在敵人的隊伍成功摧毀其他小型塔後，基地是很脆弱的，整個比賽過程的中心是對塔的攻防，以及英雄與英雄之間的團戰。

在第一場比賽中，OpenAI Five 讓對手OG大吃一驚，透過一系列激進戰術獲得了勝利，其中包括對遊戲中獲取的金幣的花費方式，在本方英雄死亡時立即課金復活，即使在比賽初期也是如此。

對此，OpenAI 首席技術長Greg Brockman指出，OpenAI 喜歡有利於短期收益的戰略，說明在長期規劃上不如人類，而且《Dota 2》這種遊戲通常要依賴於長期規劃才能獲勝。然而，在這場比賽中，這種早期就課金復活的策略得到了回報，OpenAI Five獲得了優勢，當比賽拖入30分鐘時，OG頂不住了。

We see this happen in test games all the time: the bots buy back, the humans laugh, and then the humans lose. Hard to know if it’ll happen here too...
— Greg Brockman (@gdb) 2019年4月13日　　

在第二場比賽中，OpenAI 表現更好，在最初的幾分鐘內即獲得了對OG的先期優勢，然後無情碾壓了人類玩家，在第一場比賽時間剛剛過半的時間點上即取得勝利。

值得注意的是，OpenAI Five在第二場比賽中開始玩得異常激進，以及 OG 在 AI 全圖範圍內的推進時有些無力對抗。OpenAI Five能夠利用其特定的英雄選擇帶來的優勢。

This is probably over already, sadly. OpenAI have four of the top five heroes ranked by net worth. At ten minutes in, against bots with the execution of OpenAI , this is really bad. #OpenAI five
— mike cook (@mtrc) 2019年4月13日　　

飛速進化的OpenAI Five：已經訓練4.5萬年

去年8月，OpenAI Five曾以3:2擊敗半職業人類玩家，不過當面對職業對手時，OpenAI 便輸給了paiNGaming戰隊。

根據OpenAI 聯合創始人兼主席Greg Brockman（也是該組織的CTO）的說法，在輸掉比賽之後，OpenAI Five是透過在加速的虛擬環境中進行自我改進而變得更加強大的。

OpenAI Five由深度強化學習提供支持，也就是說它的編碼目的不是「如何遊戲」，而是「如何學習」。Brockman在比賽開始前表示。AI在10個月中，已經玩了45,000年的《Dota 2》遊戲，而且，玩了這麼長時間也沒有覺得無聊。

這場比賽採用三戰兩勝制，所有bot都使用相同的深度強化學習技術進行訓練，並由同一OpenAI 系統的不同層獨立控制。

　　OpenAI 向公眾開放與AI對決，終極目標是實現通用人工智慧

對於OpenAI 來說，值得慶祝的不僅僅是這次勝利，還因為其證明了對強化學習的態度及其關於AI的普適哲學樹立的里程碑。

研究團隊將不再公開展示其AI遊戲bot，而是致力於開發軟體，讓人類與OpenAI Five軟體即時協作，與機器人一起玩遊戲，並學習他們獨特的前所未有的戰略和行為。

Special announcement: we’re inviting the entire Internet to play OpenAI Five (whether as a competitor or teammate) at once.

Sign up today! Very excited to see what we learn from observing OpenAI Five in the wild. pic.twitter.com/TaMhxdgVIt
— Greg Brockman (@gdb) 2019年4月13日　　

OpenAI Five還發佈了一個平台，供公眾與OpenAI Five對戰，這種模式稱為「競技場」模式，將於4月18日起開放三天。OpenAI 表示，協作軟體可能永遠不會向公眾開放，不過大家可以在活動中親自嘗試一下。

OpenAI 的聯合創始人兼首席執行長SamAltman還表示，此類工作證明了與AI智慧體的合作可能會在未來帶來巨大的利益。

Altman說：「對於世界如何運作，如何訓練這些智慧體，令其實現協作上，這次活動是重要的一課。實現人類與AI的合作，是我們對未來世界更積極的願景之一，人工智慧與人類共同努力，使人類變得更好、更有趣、更有影響力。」

OpenAI 可能會繼續涉足《Dota 2》和其他視頻遊戲，主要是因為這些遊戲是人工智慧的良好測試平台，也是衡量AI技術進步的良好基準測試工具。

現在可能還沒有一個遊戲像OpenAI Five這樣，AI系統最終無法具備超出人類能力的水準。對於更廣泛的AI行業而言，精通視頻遊戲可能很快就會變得過時，我們需要簡單的方式來證明AI系統可以快速學習，並能夠更快速高效地的解決現實世界的困難任務，獲得更有意義的好處。

最終，OpenAI 希望將其《Dota 2》學習並擴展到遊戲之外的新領域，並最終擴展到現實世界中。為此，OpenAI 正致力於使用強化學習和其他技術，為機器人手提供更靈巧、更精細、更人性化的動作。

「OpenAI 正在努力的方向建立通用人工智慧（AGI），並與世界分享這些好處，同時確保其安全性。」Altman說的是建立一個能夠執行任何人類任務的多功能AI系統。「我們的目標不是戰勝電子遊戲，雖然這很有趣。我們的目標是揭開實現AGI道路上的祕密。」