(資料圖片僅供參考)
據(jù)英國《新科學(xué)家》網(wǎng)站12月1日報道,總部位于英國的“深度思維”公司研發(fā)的新人工智能“DeepNash”(深度納什)學(xué)會了在“西洋陸軍棋”(Stratego)游戲中,使用虛張聲勢等欺騙手段來擊敗人類對手。在與專業(yè)人類玩家進(jìn)行的50場排名賽中,“深度納什”得勝率為84%,躋身前三名。相關(guān)研究刊發(fā)于最新一期《科學(xué)》雜志。
西洋陸軍棋是一款極其復(fù)雜的游戲,有10535種可能的游戲場景。相比之下,國際象棋和撲克要少得多?!吧疃人季S”公司的朱利安·佩羅拉特表示:“最令人驚訝的是,‘深度納什’學(xué)會了在游戲中使用較弱的棋子虛張聲勢,而且會為了勝利犧牲重要棋子。”
研究團隊指出,“深度納什”通過在55億場游戲中與自己對決來攻克西洋陸軍棋。它沒有試圖通過搜索所有可能的游戲場景來進(jìn)行游戲,也沒有被訓(xùn)練與特定選手比賽,而是利用一種算法不斷將其行為導(dǎo)向經(jīng)濟博弈論所指導(dǎo)的最優(yōu)策略,該最佳策略能保證其與完美對手的勝率至少為50%。
美國紐約大學(xué)副教授朱利安·托格利烏斯表示,在此策略下,盡管對手會隱藏一些信息,該游戲存在大量可能的游戲場景,每個回合都可采取許多不同的手段,“深度納什”仍能作出決策取得勝利,“這是一件我們以前無法真正做到的事情”。
“深度納什”已經(jīng)戰(zhàn)勝了人類和人工智能對手。在通過在線游戲平臺與專業(yè)人類玩家進(jìn)行的50場排名賽中,它的得勝率為84%,躋身前三名。在與西洋陸軍棋頂級游戲機器人,包括此前贏得該游戲世界計算機錦標(biāo)賽的幾款機器人進(jìn)行的比賽中,它也取得了97%的勝率。
馬耳他大學(xué)的喬治斯·揚納卡斯基說:“優(yōu)秀的玩家往往會記住對手的棋子并預(yù)測他們的部署模式?!疃燃{什’在這兩方面都做得很好:在記憶力方面它可能更具競爭優(yōu)勢,而且,它會虛張聲勢、出其不意?!?/p>