
AI即將與世界撲克高手對決
北京時間1月12日消息,加拿大與捷克研究人員開發(fā)了撲克機(jī)器人,它已經(jīng)在一對一比賽和無限下注德州撲克比賽中打敗了人類職業(yè)玩家,撲克機(jī)器人的勝利標(biāo)志著AI取得了新的突破。
研究人員稱,程序用“逼近法”打敗了人類對手,“逼近法”與直覺有點(diǎn)相似。密歇根大學(xué)游戲理論與AI教授邁克爾·韋爾曼(Michael Wellman)認(rèn)為:“如果真是這樣,意味著游戲AI取得了明顯進(jìn)步。首先,它是一個里程碑,AI在游戲中打敗了撲克職業(yè)玩家。其次,它將一些新創(chuàng)意結(jié)合在一起,開創(chuàng)了激動人心的新方法,我們可以用這種方法應(yīng)付信息不完全的游戲。”
本周晚些時候,匹茲堡賭場將會舉辦撲克錦標(biāo)賽,到時幾名世界級撲克玩家將會與卡內(nèi)基梅隆大學(xué)開發(fā)的程序?qū)Q。卡內(nèi)基梅隆大學(xué)計算機(jī)教授圖奧馬斯·桑德赫爾(Tuomas Sandholm)是程序的主要開發(fā)者,他說參賽的選手比之前測試時的選手強(qiáng)很多,在20多天的比賽中,玩家將會打出12萬手撲克,研究人員可以統(tǒng)計數(shù)據(jù),為開發(fā)工作提供幫助。一直以來,人們認(rèn)為撲克對于電腦來說過于復(fù)雜,錦標(biāo)賽也許可以向我們證明AI已經(jīng)可以在撲克上超越人類了。
撲克軟件DeepStack曾經(jīng)打敗過職業(yè)玩家,它是加拿大阿爾伯塔大學(xué)計算機(jī)教授邁克爾·保林(Michael Bowling)領(lǐng)導(dǎo)開發(fā)的,查爾斯特大學(xué)和捷克理工大學(xué)的研究人員也參與了研發(fā)。網(wǎng)上刊發(fā)了一份研究報告,研究人員在報告中表示,DeepStack與幾名人類玩家比賽,打了4.5萬手撲克,輕松獲勝。
人類也曾與AI在其它游戲中對決,相比而言撲克更加復(fù)雜。撲克不確定因素很多,比如對手可能會欺騙,在現(xiàn)實(shí)世界中到處都是欺騙,AI還不懂得怎樣欺騙。撲克玩家看不到對手的牌,但在西洋棋、國際象棋和圍棋中,大家可以看清對方的棋子。今年年初時,Alphabet子公司DeepMind開發(fā)的AI程序打敗了李世石,他是韓國知名職業(yè)圍棋高手。
對于機(jī)器來說,不限注德州撲克太難了,每一手牌都有10的160次方種(10的后面跟160個0)可能。DeepStack通過自己與自己打撲克不斷學(xué)習(xí)。每打完一局,系統(tǒng)就會修改優(yōu)化策略,讓技能更上層樓。由于不限注撲克很復(fù)雜,系統(tǒng)通過玩限注撲克來提高技巧。為了處理復(fù)雜性問題,研究人員使用了快速逼近技術(shù),他們將之前的撲克比賽資料輸入深度學(xué)習(xí)算法,不斷優(yōu)化精煉。
密歇根大學(xué)韋爾曼認(rèn)為,撲克是一種復(fù)雜的游戲,采用新技術(shù)之后,系統(tǒng)碰到各種情況都可以有效應(yīng)對,這是新的突破;以前要繪制整個樹,將各種可能性找出來。
研究人員將DeepStack的逼近技術(shù)與人類玩家的直覺類比,當(dāng)對手欺騙或者拿到一手可以獲勝的牌時,人類會用直覺判斷,比如根據(jù)對手的語言來判斷,機(jī)器不同,它根據(jù)對手的下注模式來判斷。研究人員稱:“我們可以將這種估計看成是DeepStack的直覺。”
通過觀察撲克玩家在多次對決中贏得的金額,系統(tǒng)可以評估玩家的表現(xiàn),而不是根據(jù)桌面上的下注額判斷。與優(yōu)秀的職業(yè)選手相比,DeepStack的勝率高了大約9倍。
2015年,保林與阿爾伯塔大學(xué)的同事找到了解決方案,他們開發(fā)的撲克機(jī)器可以玩限注德州撲克,表現(xiàn)很完美。參加匹茲堡錦標(biāo)賽的機(jī)器人名叫“Libratus”,它是圖奧馬斯·桑德赫爾(Tuomas Sandholm)與學(xué)生諾姆·布朗(Noam Brown)合作開發(fā)的,Libratus用匹茲堡超級計算中心的強(qiáng)大硬件運(yùn)行。
特別提醒:本網(wǎng)信息來自于互聯(lián)網(wǎng),目的在于傳遞更多信息,并不代表本網(wǎng)贊同其觀點(diǎn)。其原創(chuàng)性以及文中陳述文字和內(nèi)容未經(jīng)本站證實(shí),對本文以及其中全部或者部分內(nèi)容、文字的真實(shí)性、完整性、及時性本站不作任何保證或承諾,并請自行核實(shí)相關(guān)內(nèi)容。本站不承擔(dān)此類作品侵權(quán)行為的直接責(zé)任及連帶責(zé)任。如若本網(wǎng)有任何內(nèi)容侵犯您的權(quán)益,請及時聯(lián)系我們,本站將會在24小時內(nèi)處理完畢。
相關(guān)推薦
- 華納云香港高防服務(wù)器150G防御4.6折促銷,低至6888元/月,CN2大帶寬直連清洗,終身循環(huán)折扣
- 2025年國內(nèi)免費(fèi)AI工具推薦:文章生成與圖像創(chuàng)作全攻略
- 自媒體推廣實(shí)時監(jiān)控從服務(wù)器帶寬到用戶行為解決方法
- 站長必讀:從“流量思維”到“IP思維”的品牌升級之路
- 從流量變現(xiàn)到信任變現(xiàn):個人站長的私域運(yùn)營方法論
- 傳統(tǒng)網(wǎng)站如何借力短視頻?從SEO到“內(nèi)容種草”的轉(zhuǎn)型策略
- AI時代,個人站長如何用AI工具實(shí)現(xiàn)“一人公司”
- 個人站長消亡論?從“消失”到“重生”的三大破局路徑