
AI即將與世界撲克高手對(duì)決
北京時(shí)間1月12日消息,加拿大與捷克研究人員開(kāi)發(fā)了撲克機(jī)器人,它已經(jīng)在一對(duì)一比賽和無(wú)限下注德州撲克比賽中打敗了人類(lèi)職業(yè)玩家,撲克機(jī)器人的勝利標(biāo)志著AI取得了新的突破。
研究人員稱,程序用“逼近法”打敗了人類(lèi)對(duì)手,“逼近法”與直覺(jué)有點(diǎn)相似。密歇根大學(xué)游戲理論與AI教授邁克爾·韋爾曼(Michael Wellman)認(rèn)為:“如果真是這樣,意味著游戲AI取得了明顯進(jìn)步。首先,它是一個(gè)里程碑,AI在游戲中打敗了撲克職業(yè)玩家。其次,它將一些新創(chuàng)意結(jié)合在一起,開(kāi)創(chuàng)了激動(dòng)人心的新方法,我們可以用這種方法應(yīng)付信息不完全的游戲。”
本周晚些時(shí)候,匹茲堡賭場(chǎng)將會(huì)舉辦撲克錦標(biāo)賽,到時(shí)幾名世界級(jí)撲克玩家將會(huì)與卡內(nèi)基梅隆大學(xué)開(kāi)發(fā)的程序?qū)Q??▋?nèi)基梅隆大學(xué)計(jì)算機(jī)教授圖奧馬斯·桑德赫爾(Tuomas Sandholm)是程序的主要開(kāi)發(fā)者,他說(shuō)參賽的選手比之前測(cè)試時(shí)的選手強(qiáng)很多,在20多天的比賽中,玩家將會(huì)打出12萬(wàn)手撲克,研究人員可以統(tǒng)計(jì)數(shù)據(jù),為開(kāi)發(fā)工作提供幫助。一直以來(lái),人們認(rèn)為撲克對(duì)于電腦來(lái)說(shuō)過(guò)于復(fù)雜,錦標(biāo)賽也許可以向我們證明AI已經(jīng)可以在撲克上超越人類(lèi)了。
撲克軟件DeepStack曾經(jīng)打敗過(guò)職業(yè)玩家,它是加拿大阿爾伯塔大學(xué)計(jì)算機(jī)教授邁克爾·保林(Michael Bowling)領(lǐng)導(dǎo)開(kāi)發(fā)的,查爾斯特大學(xué)和捷克理工大學(xué)的研究人員也參與了研發(fā)。網(wǎng)上刊發(fā)了一份研究報(bào)告,研究人員在報(bào)告中表示,DeepStack與幾名人類(lèi)玩家比賽,打了4.5萬(wàn)手撲克,輕松獲勝。
人類(lèi)也曾與AI在其它游戲中對(duì)決,相比而言撲克更加復(fù)雜。撲克不確定因素很多,比如對(duì)手可能會(huì)欺騙,在現(xiàn)實(shí)世界中到處都是欺騙,AI還不懂得怎樣欺騙。撲克玩家看不到對(duì)手的牌,但在西洋棋、國(guó)際象棋和圍棋中,大家可以看清對(duì)方的棋子。今年年初時(shí),Alphabet子公司DeepMind開(kāi)發(fā)的AI程序打敗了李世石,他是韓國(guó)知名職業(yè)圍棋高手。
對(duì)于機(jī)器來(lái)說(shuō),不限注德州撲克太難了,每一手牌都有10的160次方種(10的后面跟160個(gè)0)可能。DeepStack通過(guò)自己與自己打撲克不斷學(xué)習(xí)。每打完一局,系統(tǒng)就會(huì)修改優(yōu)化策略,讓技能更上層樓。由于不限注撲克很復(fù)雜,系統(tǒng)通過(guò)玩限注撲克來(lái)提高技巧。為了處理復(fù)雜性問(wèn)題,研究人員使用了快速逼近技術(shù),他們將之前的撲克比賽資料輸入深度學(xué)習(xí)算法,不斷優(yōu)化精煉。
密歇根大學(xué)韋爾曼認(rèn)為,撲克是一種復(fù)雜的游戲,采用新技術(shù)之后,系統(tǒng)碰到各種情況都可以有效應(yīng)對(duì),這是新的突破;以前要繪制整個(gè)樹(shù),將各種可能性找出來(lái)。
研究人員將DeepStack的逼近技術(shù)與人類(lèi)玩家的直覺(jué)類(lèi)比,當(dāng)對(duì)手欺騙或者拿到一手可以獲勝的牌時(shí),人類(lèi)會(huì)用直覺(jué)判斷,比如根據(jù)對(duì)手的語(yǔ)言來(lái)判斷,機(jī)器不同,它根據(jù)對(duì)手的下注模式來(lái)判斷。研究人員稱:“我們可以將這種估計(jì)看成是DeepStack的直覺(jué)。”
通過(guò)觀察撲克玩家在多次對(duì)決中贏得的金額,系統(tǒng)可以評(píng)估玩家的表現(xiàn),而不是根據(jù)桌面上的下注額判斷。與優(yōu)秀的職業(yè)選手相比,DeepStack的勝率高了大約9倍。
2015年,保林與阿爾伯塔大學(xué)的同事找到了解決方案,他們開(kāi)發(fā)的撲克機(jī)器可以玩限注德州撲克,表現(xiàn)很完美。參加匹茲堡錦標(biāo)賽的機(jī)器人名叫“Libratus”,它是圖奧馬斯·桑德赫爾(Tuomas Sandholm)與學(xué)生諾姆·布朗(Noam Brown)合作開(kāi)發(fā)的,Libratus用匹茲堡超級(jí)計(jì)算中心的強(qiáng)大硬件運(yùn)行。
特別提醒:本網(wǎng)信息來(lái)自于互聯(lián)網(wǎng),目的在于傳遞更多信息,并不代表本網(wǎng)贊同其觀點(diǎn)。其原創(chuàng)性以及文中陳述文字和內(nèi)容未經(jīng)本站證實(shí),對(duì)本文以及其中全部或者部分內(nèi)容、文字的真實(shí)性、完整性、及時(shí)性本站不作任何保證或承諾,并請(qǐng)自行核實(shí)相關(guān)內(nèi)容。本站不承擔(dān)此類(lèi)作品侵權(quán)行為的直接責(zé)任及連帶責(zé)任。如若本網(wǎng)有任何內(nèi)容侵犯您的權(quán)益,請(qǐng)及時(shí)聯(lián)系我們,本站將會(huì)在24小時(shí)內(nèi)處理完畢。
相關(guān)推薦
- 華納云香港高防服務(wù)器150G防御4.6折促銷(xiāo),低至6888元/月,CN2大帶寬直連清洗,終身循環(huán)折扣
- 2025年國(guó)內(nèi)免費(fèi)AI工具推薦:文章生成與圖像創(chuàng)作全攻略
- 自媒體推廣實(shí)時(shí)監(jiān)控從服務(wù)器帶寬到用戶行為解決方法
- 站長(zhǎng)必讀:從“流量思維”到“IP思維”的品牌升級(jí)之路
- 從流量變現(xiàn)到信任變現(xiàn):個(gè)人站長(zhǎng)的私域運(yùn)營(yíng)方法論
- 傳統(tǒng)網(wǎng)站如何借力短視頻?從SEO到“內(nèi)容種草”的轉(zhuǎn)型策略
- AI時(shí)代,個(gè)人站長(zhǎng)如何用AI工具實(shí)現(xiàn)“一人公司”
- 個(gè)人站長(zhǎng)消亡論?從“消失”到“重生”的三大破局路徑