人工智能(AI)已經(jīng)稱霸了不少世界上最復(fù)雜的游戲,擊敗了國際象棋、圍棋、甚至是星際爭霸II等即時(shí)戰(zhàn)略電腦游戲中的頂級玩家,但其軟肋卻是一些看似簡單的游戲,一些需要具備溝通和合作能力的游戲。
這一情況可能即將發(fā)生改變。
谷歌母公司Alphabet的谷歌大腦項(xiàng)目和DeepMind的研究人員開發(fā)了曾在圍棋和星際爭霸II中擊敗人類的AI程序,現(xiàn)在他們將目光投向了一款新游戲:Hanabi(花火),一種玩家互相合作的紙牌游戲。這款游戲根據(jù)玩家在比賽中的溝通情況來確定每個人是贏還是輸。
參與該項(xiàng)目的研究人員認(rèn)為,弄清楚怎樣玩好Hanabi,這對于人工智能來說可能是一個重大進(jìn)步,并且有助于其在聊天和自動駕駛等應(yīng)用場景中與人類進(jìn)行更加流暢的互動。
“在日常生活中,人們一般不會相互競爭,而更多的是進(jìn)行溝通和合作,”牛津大學(xué)研究員JakobFoerster說,他在2月份合作發(fā)表了一篇相關(guān)論文。他還說,“Hanabi是一個關(guān)于溝通和合作的游戲,人工智能目前還沒有深入這一游戲領(lǐng)域”。
游戲提示
Hanabi游戲發(fā)明于2010年,由二到五個玩家參與,玩家需以正確的順序一起打出五種不同顏色的牌。游戲特點(diǎn):所有玩家都可以看到對方的牌,但卻看不到自己的牌。
根據(jù)游戲規(guī)則,玩家可以互相提示自己手里的牌(但僅限于牌的顏色或數(shù)字),讓其他玩家可以推斷他們應(yīng)該出什么牌,但提示的次數(shù)是有限制的。
正是這種高效溝通的行為使Hanabi具備了一種科學(xué)魅力。例如,人類可以很自然地理解其他玩家的提示,哪張卡片是可出的,但是機(jī)器本質(zhì)上無法理解這些提示。
NolanBard是DeepMind項(xiàng)目的研究員,也是上面提到的論文的合作作者。他認(rèn)為,“這些合作式的游戲各不相同且難度很大,因?yàn)闉榱送婧糜螒颍阈枰c所有玩家進(jìn)行協(xié)作,共同就某種游戲方式達(dá)成一致。
到目前為止人工智能程序已經(jīng)可以在玩Hanabi花火游戲時(shí)贏得很高分?jǐn)?shù),但只限于與其他類似的智能機(jī)器人一起玩。在不熟悉其他玩家的游戲風(fēng)格或者有“臨時(shí)”(從未一起玩過的)玩家的情況下,對程序的挑戰(zhàn)最大,也更接近真實(shí)情況。
假設(shè)和推論
根據(jù)研究人員的說法,人類在不斷構(gòu)建一種關(guān)于他人的“心理認(rèn)知”,即假設(shè)其他人像我們一樣思考和行動,并以此為基礎(chǔ)預(yù)測其行為。例如,當(dāng)有人站在街角時(shí),路過的司機(jī)會認(rèn)為她正在考慮過馬路。
研究人員認(rèn)為,在人工智能中植入這樣的認(rèn)知能力可以改善自動駕駛車輛在遇到新情況時(shí)的行為方式,使其能夠明白人們的行為背后意味著他們可能想做什么。例如,智能機(jī)器人可以學(xué)習(xí)并理解對話中的語境,以便推斷說話者的想法。
為了闡明人工智能目前還缺乏這種能力,Bard博士使用一臺已經(jīng)訓(xùn)練好的計(jì)算機(jī)來玩石頭剪刀布游戲。計(jì)算機(jī)出石頭、剪子和布的次數(shù)將相同,并預(yù)計(jì)有一半的機(jī)會會贏。
但是如果其人類對手每次都出同樣的手勢,那么標(biāo)準(zhǔn)的算法就無法理解人類對手的想法,并據(jù)此轉(zhuǎn)變其策略。Bard說,計(jì)算機(jī)要在玩了10回后才會意識到人類總是出石頭而它應(yīng)該出布。
在其他游戲方面,人工智能程序在橋牌游戲中已經(jīng)取得了進(jìn)展,但還不是玩得很好,部分原因在于人工智能還需要溝通技能。許多紙牌類游戲都存在類似的問題,機(jī)器很難分辨玩家行為背后所隱含的信息。
位于舊金山的OpenAI是由諸多硅谷大亨聯(lián)合建立的人工智能非營利組織,其工程師JeffWu開發(fā)了一種智能機(jī)器人,用一種稱為“猜帽子”的策略來玩Hanabi。這種策略以復(fù)雜的方式向其他玩家給出提示,告訴這些玩家哪些牌可以打。
注:“猜帽子”這個名字取自一個流行的邏輯訓(xùn)練,即一群人試圖猜測他們每個人頭頂帽子的顏色。
盡管Wu的機(jī)器人在玩Hanabi時(shí)分?jǐn)?shù)很高,但他認(rèn)為要使Hanabi機(jī)器人擁有可以和未知對手合作的認(rèn)知能力仍然是一個巨大的挑戰(zhàn)。
“在玩猜帽子時(shí),機(jī)器人沒有認(rèn)知能力,它們心中只有自我以及其副本的概念,如果你只是自己跟自己玩,這是可以的,”Wu說。“但如果你試圖開發(fā)一個真正具有心理認(rèn)知能力的機(jī)器人,并且它可以明白其他人在思考和做什么,那將是個大挑戰(zhàn)。”
DeepMind的Hanabi研究小組創(chuàng)建了一個開源平臺,人們可以在其上測試相關(guān)的人工智能程序和算法,但小組成員并不期待很快能找到解決方案。Foerster博士說,如果只花了五年的時(shí)間就可以使人工智能具備能力和未知玩家進(jìn)行游戲,他覺得不靠譜。
盡管如此,紐約大學(xué)副教授JulianTogelius表示,像Hanabi這樣的游戲是創(chuàng)新的沃土。“隨著其不斷發(fā)展,游戲設(shè)計(jì)已經(jīng)成為人類智力能力發(fā)展的持續(xù)反映,”他說。“如果存在某種形式的人工智能場景,那么就會有人適時(shí)地設(shè)計(jì)出一種能夠運(yùn)用這種場景的游戲。”
-
游戲
+關(guān)注
關(guān)注
2文章
790瀏覽量
27467 -
人工智能
+關(guān)注
關(guān)注
1817文章
50098瀏覽量
265419
原文標(biāo)題:為什么紙牌游戲Hanabi是人工智能的下一個挑戰(zhàn)?
文章出處:【微信號:szwlw26059696,微信公眾號:物聯(lián)網(wǎng)之聲】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
嵌入式開發(fā)是否會成為下一個被看好的領(lǐng)域?
半導(dǎo)體測試,是“下一個前沿”
云知聲受邀出席2025人工智能+大會
思必馳受邀出席2025人工智能+大會
科技云報(bào)到:西湖大學(xué)、智元機(jī)器人都選它,存儲成為AI下一個風(fēng)口
40個項(xiàng)目脫穎而出!2025英特爾人工智能大賽圓滿收官,下一個AI應(yīng)用浪潮開啟
【原創(chuàng)】TDMS設(shè)置下一個寫入位置函數(shù)的摸索
挖到寶了!人工智能綜合實(shí)驗(yàn)箱,高校新工科的寶藏神器
挖到寶了!比鄰星人工智能綜合實(shí)驗(yàn)箱,高校新工科的寶藏神器!
關(guān)于人工智能處理器的11個誤解
為什么紙牌游戲Hanabi是人工智能的下一個挑戰(zhàn)?
評論