久久久久久久视色,久久电影免费精品,中文亚洲欧美乱码在线观看,在线免费播放AV片

<center id="vfaef"><input id="vfaef"><table id="vfaef"></table></input></center>

<p id="vfaef"><kbd id="vfaef"></kbd></p>

<pre id="vfaef"><u id="vfaef"></u></pre>

<thead id="vfaef"><input id="vfaef"></input></thead>

<pre id="1gvde"></pre>

<small id="1gvde"><kbd id="1gvde"></kbd></small>

<ruby id="1gvde"></ruby>

當(dāng)前位置：站長(zhǎng)資訊網(wǎng) > 新聞資訊 > 正文

最后的人機(jī)圍棋大戰(zhàn)，柯潔能否一勝？

2019-07-02 分類(lèi)：新聞資訊閱讀(763) 評(píng)論(0)

最后的人機(jī)圍棋大戰(zhàn)，柯潔能否一勝？

　　直到最后一刻，20歲的柯潔都在努力去贏對(duì)手人工智能AlphaGo一盤(pán)棋?？聺嵤侵袊?guó)圍棋職業(yè)九段棋手，現(xiàn)今圍棋等級(jí)分排名世界第一。

　　2017年5月25日下午1點(diǎn)37分時(shí)，浙江烏鎮(zhèn)，柯潔將三顆白子撂在黃棋盤(pán)上認(rèn)輸，來(lái)不及整理一下吃敗仗后的沮喪表情，立刻與對(duì)手開(kāi)始復(fù)盤(pán)。兩天前的同一個(gè)場(chǎng)地，他已經(jīng)輸了第一盤(pán)，按照賽前規(guī)定，此番認(rèn)輸表示整個(gè)比賽，三決兩勝，他已經(jīng)輸?shù)袅苏麄€(gè)比賽。

　　但是，接下來(lái)新聞發(fā)布會(huì)上，柯潔當(dāng)著眾多記者的面，向AlphaGo研發(fā)公司Deepmind負(fù)責(zé)人哈薩比斯?fàn)幦∽詈笠槐P(pán)對(duì)抗執(zhí)白棋權(quán)益。按照之前猜先規(guī)矩，第一盤(pán)柯潔執(zhí)黑，第二盤(pán)執(zhí)白，第三盤(pán)應(yīng)該執(zhí)黑。業(yè)界知道，柯潔執(zhí)白棋勝率遠(yuǎn)高于黑棋。

　　按照本次圍棋峰會(huì)日程，26日舉行配對(duì)賽和中國(guó)圍棋五人團(tuán)隊(duì)與AlphaGo對(duì)弈。據(jù)現(xiàn)場(chǎng)解說(shuō)員、柯潔朋友古力透露，柯潔提出想成為這場(chǎng)對(duì)抗賽的擺棋“人肉臂”，被主辦方拒絕。顯然，這位人類(lèi)圍棋“代表”者柯潔，一直在爭(zhēng)取點(diǎn)滴機(jī)會(huì)多了解對(duì)手AlphaGo。

　　26日當(dāng)天舉行的配對(duì)賽和團(tuán)隊(duì)對(duì)弈AlphaGo，柯潔雖然沒(méi)有作為選手登場(chǎng)，也沒(méi)有像第一場(chǎng)失利之后去池塘釣魚(yú)、拉弓射箭，而是一直泡在后方研究室里，關(guān)注場(chǎng)上比賽變化。據(jù)AlphaGo官方團(tuán)隊(duì)證實(shí)，柯潔當(dāng)天下午觀(guān)看中國(guó)五人團(tuán)體對(duì)戰(zhàn)AlphaGo過(guò)程中，首先在一步棋上提出了靠完尖的下法，被其他棋手嘲笑否定。不久之后，AlphaGo使出了一模一樣的著法。

　　某種程度上，柯潔是在為人類(lèi)棋手而戰(zhàn)，也是在為自己而戰(zhàn)。2016年3月，AlphaGo在韓國(guó)首爾與李世石對(duì)戰(zhàn)五局中，輸?shù)舻谒木?。李世石成為目前?zhàn)勝過(guò)人工智能AlphaGo的最后一人。如果柯潔不能勝一盤(pán)AlphaGo，歷史將會(huì)像記住戰(zhàn)勝過(guò)IBM深藍(lán)電腦的國(guó)際象棋冠軍卡斯帕羅夫、第一個(gè)登月的阿姆斯特朗一樣記住李世石，而不是柯潔。

　　兩次與現(xiàn)場(chǎng)預(yù)判相反的逆轉(zhuǎn)

　　從最初看不上眼，到贏了韓國(guó)棋手李世石之后被震驚，再到稱(chēng)呼AlphaGo為“阿老師”，圍棋手們?cè)诓粩嗟卣{(diào)整著對(duì)于人工智能最新代表者AlphaGo的認(rèn)知。峰會(huì)上，最讓中國(guó)棋手們渴望和興奮的是試圖找到AlphaGo一些破綻。

　　中國(guó)圍棋隊(duì)總教練俞斌此前表示，AlphaGo的弱點(diǎn)，在去年對(duì)李世石第四盤(pán)中所表現(xiàn)出來(lái)的“無(wú)中生有”的失誤，當(dāng)李世石下出第78手妙棋之后，AlphaGo開(kāi)始失常。他將這種失誤稱(chēng)為“開(kāi)放性計(jì)算的誤算”。這種誤算在AlphaGo對(duì)李世石第五局的角上計(jì)算也出現(xiàn)過(guò)。

　　人們覺(jué)得AlphaGo是電腦，擅長(zhǎng)計(jì)算，可能不擅長(zhǎng)從大局考慮。經(jīng)過(guò)幾番對(duì)戰(zhàn)，棋手們推翻了此前判斷，他們發(fā)現(xiàn)AlphaGo駕馭大局能力并不比人類(lèi)弱，很難從中占到便宜。又有人大膽提出，AlphaGo可能擅長(zhǎng)布局，不擅長(zhǎng)計(jì)算;還有人提出AlphaGo下棋，重?fù)茖?shí)地，不重形勢(shì)。像盲目摸象，人類(lèi)棋手不停地嘗試著。

　　另外，有棋手們推斷，人工智能?chē)褰?jīng)常走棋時(shí)刪繁就簡(jiǎn)，不造劫材，可能不擅長(zhǎng)“應(yīng)劫”，多多打劫可能會(huì)讓電腦犯糊涂，并舉出網(wǎng)上一些贏了AI圍棋的例子證明，不斷挑起肉搏，在亂戰(zhàn)中尋找機(jī)會(huì)殺死AI圍棋大龍方才有獲勝機(jī)會(huì)。

　　以上這些因暫時(shí)沒(méi)有人類(lèi)戰(zhàn)勝AlphaGo和今年初AlphaGo匿名化身的Master，無(wú)從證明。

　　倒是現(xiàn)場(chǎng)解說(shuō)員，對(duì)于棋盤(pán)上勝負(fù)預(yù)期兩次與最終AlphaGo走出的結(jié)果完全相反，著實(shí)讓現(xiàn)場(chǎng)的觀(guān)眾和解說(shuō)員一起好久難以緩過(guò)勁來(lái)。

　　第一次來(lái)自柯潔25日與AlphaGo的第二場(chǎng)比賽。開(kāi)局至前100手，棋手古力九段根據(jù)柯潔臉上表情、較少揪頭發(fā)的動(dòng)作和棋盤(pán)上局勢(shì)得出柯潔的棋相當(dāng)樂(lè)觀(guān)，有獲勝的希望。“AlphaGo之父”哈薩比斯(Demis Hassabis)在11：32通過(guò)社交網(wǎng)絡(luò)對(duì)外稱(chēng)：“根據(jù)AlphaGo的評(píng)估，柯潔此時(shí)此刻下的非常完美。”當(dāng)時(shí)比賽還在進(jìn)行當(dāng)中，這條推文截圖立刻在現(xiàn)場(chǎng)傳播。觀(guān)眾有些興奮，期待柯潔代表人類(lèi)給機(jī)器一個(gè)教訓(xùn)。

　　這個(gè)希望隨著柯潔投子認(rèn)輸而泯滅。

　　第二次是26日上午連笑+AlphaGo一起對(duì)戰(zhàn)古力+AlphaGo，現(xiàn)場(chǎng)氣氛隨著解說(shuō)員引導(dǎo)，認(rèn)為時(shí)間相對(duì)充裕的古力一方勝券在握。結(jié)果卻是古力一方AlphaGo主動(dòng)投降，古力拒絕，下了十來(lái)手之后，古力認(rèn)識(shí)到大勢(shì)已去，親自舉起投降牌子。

　　賽后，騰訊科技追隨著一名現(xiàn)場(chǎng)解說(shuō)員問(wèn)為何出現(xiàn)逆轉(zhuǎn)情況、AlphaGo和古力誰(shuí)下出惡手等問(wèn)題，此位解說(shuō)員思緒一直停留在比賽中，難以回神應(yīng)答。

　　AlphaGo帶給人類(lèi)圍棋界的震驚仍然在繼續(xù)，并擴(kuò)大著影響范圍。只是很多人現(xiàn)場(chǎng)見(jiàn)證之后，感受更為深刻——很多人是懵的，包括職業(yè)棋手和一些專(zhuān)家。

　　這或許意味著，在遠(yuǎn)超人類(lèi)計(jì)算能力的人工智能AlphaGo面前，職業(yè)棋手與業(yè)余棋手之間的差距，可能沒(méi)有職業(yè)棋手與AlphaGo之間差距大，整個(gè)圍棋界將因?yàn)锳lphaGo的存在引起一些固有結(jié)構(gòu)的崩塌。這之后，誰(shuí)能有與AlphaGo切磋棋藝的機(jī)會(huì)，誰(shuí)就有可能更快地成長(zhǎng)，走得更遠(yuǎn)。

　　更強(qiáng)的AlphaGo

　　如果烏鎮(zhèn)峰會(huì)上柯潔勝一局，意義將不同于去年李世石取勝。

　　5月24日，在新版本AlphaGo首戰(zhàn)以1/4子優(yōu)勢(shì)戰(zhàn)勝柯潔之后，DeepMind創(chuàng)始人兼CEO 哈薩比斯、AlphaGo團(tuán)隊(duì)負(fù)責(zé)人David Silver在人工智能高峰論壇上稱(chēng)，“AlphaGo已經(jīng)可以模仿人類(lèi)直覺(jué)。在過(guò)去一年，我們想打造完美的AlphaGo，彌補(bǔ)它知識(shí)方面的空白。因?yàn)樵谂c李世石的比賽中，它是有缺陷的。”哈薩比斯說(shuō)。據(jù)介紹，AlphaGo升級(jí)后新版本可以讓老版本三個(gè)子。

　　哈薩比斯稱(chēng)圍棋因?yàn)樘^(guò)復(fù)雜，窮舉搜索難以解決。對(duì)于計(jì)算機(jī)來(lái)說(shuō)，圍棋有兩項(xiàng)難題：很難寫(xiě)出評(píng)估程序以決定誰(shuí)贏;搜索空間太過(guò)龐大。

　　圍棋不像象棋等游戲靠計(jì)算，而是靠直覺(jué)。圍棋中沒(méi)有等級(jí)概念，所有棋子都一樣。圍棋是筑防游戲，因此需要盤(pán)算未來(lái)。為此，AlphaGo團(tuán)隊(duì)用兩種卷積神經(jīng)網(wǎng)絡(luò)去完成：策略網(wǎng)絡(luò)和估值網(wǎng)絡(luò)。策略網(wǎng)絡(luò)的卷積神經(jīng)網(wǎng)絡(luò)用于決定下一步落子可能的位置，價(jià)值網(wǎng)絡(luò)用于評(píng)估當(dāng)前棋局獲勝的概率。

　　為了應(yīng)對(duì)圍棋巨大復(fù)雜性，AlphaGo 采用機(jī)器學(xué)習(xí)技術(shù)，結(jié)合了監(jiān)督學(xué)習(xí)和強(qiáng)化學(xué)習(xí)的優(yōu)勢(shì)。通過(guò)訓(xùn)練形成一個(gè)策略網(wǎng)絡(luò)(policy network)，將棋盤(pán)上的局勢(shì)作為輸入信息，并對(duì)所有可行的落子位置生成一個(gè)概率分布。

最后的人機(jī)圍棋大戰(zhàn)，柯潔能否一勝？

　　然后，訓(xùn)練出一個(gè)價(jià)值網(wǎng)絡(luò)(value network)對(duì)自我對(duì)弈進(jìn)行預(yù)測(cè)，以 -1(對(duì)手的絕對(duì)勝利)到1(AlphaGo的絕對(duì)勝利)的標(biāo)準(zhǔn)，預(yù)測(cè)所有可行落子位置的結(jié)果。這兩個(gè)網(wǎng)絡(luò)自身都十分強(qiáng)大，而 AlphaGo將這兩種網(wǎng)絡(luò)整合進(jìn)基于概率的蒙特卡羅樹(shù)搜索(MCTS)中，實(shí)現(xiàn)了它真正的優(yōu)勢(shì)。最后，新版的AlphaGo 產(chǎn)生大量自我對(duì)弈棋局，為下一代版本提供了訓(xùn)練數(shù)據(jù)，此過(guò)程循環(huán)往復(fù)。

　　地平線(xiàn)創(chuàng)始人、百度前深度學(xué)習(xí)研究院負(fù)責(zé)人余凱告訴騰訊科技，這次AlphaGo來(lái)到中國(guó)，技術(shù)提升的進(jìn)步體現(xiàn)在兩方面，一方面是AlphaGo 2.0算法，更多強(qiáng)調(diào)通過(guò)自我博弈，加上通過(guò)學(xué)習(xí)人類(lèi)棋手的歷史數(shù)據(jù)提升棋藝，一般來(lái)說(shuō)，人工智能需要大數(shù)據(jù)，而AlphaGo這種做法，并不需要那么多大數(shù)據(jù)，從零開(kāi)始，提升棋藝。“我覺(jué)得這具有革命性意義。”

　　另一方面，Deepmind母公司自己研發(fā)的新型架構(gòu)處理器TPU的使用，做到了AlphaGo“單機(jī)版”，進(jìn)一步減少了對(duì)處理器數(shù)量的需求。

　　曾經(jīng)，人工智能學(xué)界認(rèn)為傳統(tǒng)硬件很難進(jìn)一步提升AlphaGo棋力。去年李世石與AlphaGo開(kāi)戰(zhàn)之前，創(chuàng)新工場(chǎng)創(chuàng)辦者李開(kāi)復(fù)(微博)在知乎上撰文說(shuō)明，下圍棋計(jì)算，需要增加硬件。線(xiàn)性地從1202個(gè)CPU增加到1920個(gè)CPU，AlphaGo的技戰(zhàn)指數(shù)(ELO)只增加了28，并未跟著跳躍增長(zhǎng)。

　　但是，TPU的出現(xiàn)極大地提高了計(jì)算性能，同時(shí)能耗更小，體積也更小。余凱認(rèn)為通過(guò)TPU加大的計(jì)算能力，硬件能力提升使得搜索進(jìn)入一個(gè)更大的求解空間。“硬件提升也是令業(yè)界矚目的。”

　　國(guó)內(nèi)人工智能芯片研發(fā)公司寒武紀(jì)曾預(yù)言，采用人工智能芯片，AlphaGo只需要一臺(tái)個(gè)人電腦大小的主機(jī)。這次烏鎮(zhèn)圍棋峰會(huì)上，雖然Deepmind公司未能完全達(dá)到，卻朝這個(gè)方面在進(jìn)步。值得一提的是，寒武紀(jì)公司創(chuàng)始人陳天石告訴騰訊科技，早期與一位法國(guó)專(zhuān)家Olivier Temam一起研究人工智能芯片，這位法國(guó)人后來(lái)加入了Deepmind的母公司，成為T(mén)PU團(tuán)隊(duì)中一員。

　　未來(lái)，更強(qiáng)的人工智能芯片的出現(xiàn)，與人類(lèi)棋手的水平將越拉越遠(yuǎn)。

　　逼至AIpahGo極限的比賽

　　一方面人類(lèi)棋手在尋找機(jī)會(huì)戰(zhàn)勝AlphaGo，另一方面，節(jié)節(jié)勝利的AlphaGo正在被神化。

　　在峰會(huì)現(xiàn)場(chǎng)，騰訊科技發(fā)現(xiàn)一個(gè)有趣現(xiàn)象。作為AlphaGo的核心人物之一，黃士杰博士充當(dāng)機(jī)械臂擺放棋子，整個(gè)比賽過(guò)程中通常面無(wú)表情，不上廁所、不喝水。不斷吃敗仗之后，人們開(kāi)始談?wù)擖S的表情，甚至開(kāi)始探究黃擺放棋子的手勢(shì)，用大拇指和用中指是否代表著不同心情。

　　本次烏鎮(zhèn)圍棋峰會(huì)之前，柯潔究竟研究了多少盤(pán)AlphaGo曾走過(guò)的棋?無(wú)人知曉。人們注意到，柯潔在與AlphaGo對(duì)局時(shí)，已經(jīng)可以熟練運(yùn)用由AlphaGo采用的一些棋招。

　　最常被人舉例的是所謂“點(diǎn)三三”走法。在對(duì)手先手占據(jù)星位時(shí)，自己再?gòu)娜肺恢么蛉?。擱在AlphaGo之前，下棋者使用此辦法，“會(huì)被老師打屁股，甚至?xí)徽J(rèn)為不會(huì)下棋”，不僅一位棋手說(shuō)。但是，從去年底和今年初AlphaGo大量應(yīng)用此招，并取得勝利之后，圍棋界對(duì)“點(diǎn)三三”做法重新評(píng)估。現(xiàn)在普遍持星位和三三位互為弱點(diǎn)，充滿(mǎn)辯證意味。

　　人與機(jī)器對(duì)弈中，人類(lèi)開(kāi)始借鑒學(xué)習(xí)人工智能。

　　23日，柯潔第一盤(pán)棋輸?shù)羲姆种蛔樱瑢儆诜€(wěn)扎穩(wěn)打下法。25日，柯潔明顯換了一種風(fēng)格，他試圖與AlphaGo激烈對(duì)抗，制造更多紛爭(zhēng)。一度，在左下角的一塊棋有劫爭(zhēng)，AlphaGo遲遲不能像慣常做法那樣化繁就簡(jiǎn)，“撐在那里”。盤(pán)面最復(fù)雜時(shí)，有七八條大龍?jiān)谙嗷ソg殺糾纏，盤(pán)面充滿(mǎn)不確實(shí)性。

　　這是柯潔最興奮的時(shí)刻，后來(lái)也被證明是他離勝利最近的時(shí)刻。當(dāng)時(shí)，他用手撫了撫心臟。“太緊張的緣故，想讓它跳得慢一點(diǎn)”，柯潔在賽后發(fā)布回顧當(dāng)時(shí)下棋感覺(jué)。

　　“柯潔在這場(chǎng)比賽中是有很多的機(jī)會(huì)。”哈薩比斯說(shuō)：“前100步是目前為止和AlphaGo下得最勢(shì)均力敵的人。”他稱(chēng)柯潔比賽中一度將AlphaGo逼至了極限。

　　遺憾的是，“興奮之后出現(xiàn)了失誤”，柯潔事后坦承未能克服人類(lèi)的情緒弱點(diǎn)。有情感的人類(lèi)與只知?jiǎng)儇?fù)概率的AlphaGo之間究竟不是同一物種。

　　現(xiàn)在看來(lái)，人類(lèi)或有可能因?yàn)锳lphaGo的棋路和棋譜，挖掘出圍棋更多的、沒(méi)有被人類(lèi)探索和理解的地方，利用得當(dāng)，會(huì)使目前圍棋整體水平再上一個(gè)臺(tái)階。重慶人工智能公司云叢科技創(chuàng)始人周曦持此觀(guān)點(diǎn)。他對(duì)騰訊科技分析說(shuō)，AlphaGo下了很多人類(lèi)理解不了的棋，打破了人類(lèi)圍棋思維定勢(shì)，使得人類(lèi)棋手更多的反思和學(xué)習(xí)。同樣的，人的學(xué)習(xí)抽象理解能力，也不是AlphaGo能掌握的。

　　未來(lái)是否會(huì)開(kāi)放AlphaGo給所有的圍棋愛(ài)好者?戰(zhàn)勝人類(lèi)棋力最強(qiáng)的柯潔之后，下一次還會(huì)舉辦此類(lèi)圍棋峰會(huì)嗎?對(duì)于騰訊科技這些問(wèn)題，AlphaGo方面核心人員之一David Silver避重就輕地給予了回答，“AlphaGo只是作為研究為主，沒(méi)有進(jìn)一步計(jì)劃。”

　　不過(guò)，有一點(diǎn)可以肯定，當(dāng)人工智能的圍棋水平遠(yuǎn)遠(yuǎn)勝過(guò)人類(lèi)之后，人類(lèi)將放棄繼續(xù)挑戰(zhàn)機(jī)器的狂想，就像今天人們已經(jīng)習(xí)慣普通電子計(jì)算器，誰(shuí)也不會(huì)與它爭(zhēng)一爭(zhēng)計(jì)算加減乘除運(yùn)算速度。也許，到那時(shí)回頭看，本次烏鎮(zhèn)圍棋峰會(huì)可能是人機(jī)大戰(zhàn)歷程中最后一個(gè)峰會(huì)。

贊(0)

標(biāo)簽：AI CPU master word 人工智能處理器大數(shù)據(jù)微博電腦百度社交網(wǎng)絡(luò)騰訊計(jì)算機(jī)論壇韓國(guó)首爾

相關(guān)推薦

網(wǎng)站地圖滬ICP備18035694號(hào)-2

滬公網(wǎng)安備31011702889846號(hào)