當(dāng)前位置：科技 >

虛張聲勢(shì)?舍車保帥?人工智能使“計(jì)”擊敗人類游戲玩家

文章來源：科技日?qǐng)?bào)　發(fā)布時(shí)間： 2022-12-05 13:07:56　責(zé)任編輯：cfenews.com

+|-

(資料圖片僅供參考)

據(jù)英國《新科學(xué)家》網(wǎng)站12月1日?qǐng)?bào)道，總部位于英國的“深度思維”公司研發(fā)的新人工智能“DeepNash”(深度納什)學(xué)會(huì)了在“西洋陸軍棋”(Stratego)游戲中，使用虛張聲勢(shì)等欺騙手段來擊敗人類對(duì)手。在與專業(yè)人類玩家進(jìn)行的50場排名賽中，“深度納什”得勝率為84%，躋身前三名。相關(guān)研究刊發(fā)于最新一期《科學(xué)》雜志。

西洋陸軍棋是一款極其復(fù)雜的游戲，有10535種可能的游戲場景。相比之下，國際象棋和撲克要少得多?！吧疃人季S”公司的朱利安·佩羅拉特表示：“最令人驚訝的是，‘深度納什’學(xué)會(huì)了在游戲中使用較弱的棋子虛張聲勢(shì)，而且會(huì)為了勝利犧牲重要棋子?！?/p>

研究團(tuán)隊(duì)指出，“深度納什”通過在55億場游戲中與自己對(duì)決來攻克西洋陸軍棋。它沒有試圖通過搜索所有可能的游戲場景來進(jìn)行游戲，也沒有被訓(xùn)練與特定選手比賽，而是利用一種算法不斷將其行為導(dǎo)向經(jīng)濟(jì)博弈論所指導(dǎo)的最優(yōu)策略，該最佳策略能保證其與完美對(duì)手的勝率至少為50%。

美國紐約大學(xué)副教授朱利安·托格利烏斯表示，在此策略下，盡管對(duì)手會(huì)隱藏一些信息，該游戲存在大量可能的游戲場景，每個(gè)回合都可采取許多不同的手段，“深度納什”仍能作出決策取得勝利，“這是一件我們以前無法真正做到的事情”。

“深度納什”已經(jīng)戰(zhàn)勝了人類和人工智能對(duì)手。在通過在線游戲平臺(tái)與專業(yè)人類玩家進(jìn)行的50場排名賽中，它的得勝率為84%，躋身前三名。在與西洋陸軍棋頂級(jí)游戲機(jī)器人，包括此前贏得該游戲世界計(jì)算機(jī)錦標(biāo)賽的幾款機(jī)器人進(jìn)行的比賽中，它也取得了97%的勝率。

馬耳他大學(xué)的喬治斯·揚(yáng)納卡斯基說：“優(yōu)秀的玩家往往會(huì)記住對(duì)手的棋子并預(yù)測他們的部署模式?！疃燃{什’在這兩方面都做得很好：在記憶力方面它可能更具競爭優(yōu)勢(shì)，而且，它會(huì)虛張聲勢(shì)、出其不意?！?/p>

關(guān)鍵詞：虛張聲勢(shì) 人工智能游戲世界舍車保帥人類游戲

更多新聞>>