AlphaGo 不出戰棋王，原因可能是DeepMind正忙著打遊戲機 | T客邦

半導體/電子產業 5G/網路 AI/大數據電動車/交通

加密貨幣/區塊鏈遊戲/電競雲端/資訊安全商業/金融

尖端科技 3C新品趨勢

抽獎/得獎公告體驗試玩活動課程講座

2024科技趨勢金獎

AlphaGo 不出戰棋王，原因可能是DeepMind正忙著打遊戲機

之前中國體育總局宣佈目前排名第一的圍棋選手柯潔將和AlphaGo進行「人機終極對決」之後，DeepMind 創始人Demis Hassabis就表示目前沒有安排AlphaGo與人類對奕的計畫。那麼，AlphaGo最近在忙些什麼呢？根據DeepMind 最近發佈的一則短片顯示，DeepMind 的工作人員最近可能在忙著「打遊戲機」。

在 AlphaGo 戰勝了韓國圍棋棋手李世石後，DeepMind 創始人Demis Hassabis就曾表示將研究以人工智慧與人類玩其他遊戲，例如即時戰略遊戲《星海爭霸》。不過目前看來，DeepMind AI 距離要跟人類比賽打《星海爭霸》這事，還是有點兒距離。

早在 2015 年，DeepMind AI 就開始用已經Atari 於1977 年發行的遊戲機 Atari 2600 來進行遊戲訓練，整個訓練過程團隊沒有提供任何額外訊息幫助，全依靠 AI 自己來一步步學習如何打怪升級。在這些遊戲裡，有一款遊戲始終讓 DeepMind AI 很苦惱，那就是《Montezuma's revenge》，這是Atari 一款難度超高的遊戲。

後來團隊找到了「好奇心」激勵機制，來讓 DeepMind AI 獲勝。他們給 AI 輸入了「人工好奇心」，在 AI 探索更多的玩法的時候給予它更多的獎勵，鼓勵它去用不同的途徑來獲取更高的分數。在新版本裡，DeepMind AI 在好奇心的驅動下探索了 15 個房間的遊戲。在沒有好奇心的時候，它只玩了 2 個房間。

而6/8， DeepMind 釋出了一段短片，看完這段短片，你會發現 DeepMind AI 在遊戲世界裡的段數還是太低。

《星海爭霸》作為一款即時戰略類的遊戲，給 DeepMind 的挑戰比圍棋更大。單單是對戰局面的資料獲取方面，兩者就相差巨大。圍棋棋盤上就只有數量不等的黑白兩色棋子作為資料，而遊戲中則包括了雙方兵力數量、兵種構成、能力屬性、時間等等等。另外作為即時戰略遊戲，《星海爭霸》需要在極短時間內執行策略，而圍棋相對來說則有充足的時間給 AI 運算思考。

目前，DeepMind AI 想要打贏《星海爭霸》還是需要更長的時間學習和摸索。想當然一時之間，DeepMind 的工作人員都還必需要忙著研究「打遊戲機」這回事。

送【10個ChatGPT的好工具】電子書 Line brand icon

使用 Facebook 留言

1. 黃遠強（發表於 2016年6月12日 23:04）

引用回覆

喝茶就選~甜心外送茶~，良心茶商比較好，
她家的妹正，服務優，價錢合理，需要加賴：759654，
說是周先生介紹的，可以立即享受VIP價

謹慎發言，尊重彼此。按此展開留言規則