久久久久久久视色,久久电影免费精品,中文亚洲欧美乱码在线观看,在线免费播放AV片

<center id="vfaef"><input id="vfaef"><table id="vfaef"></table></input></center>

<p id="vfaef"><kbd id="vfaef"></kbd></p>

<pre id="vfaef"><u id="vfaef"></u></pre>

<thead id="vfaef"><input id="vfaef"></input></thead>

當(dāng)前位置：站長資訊網(wǎng) > 新聞資訊 > 正文

最后的人機(jī)圍棋大戰(zhàn)，柯潔能否一勝？

2019-07-02 分類：新聞資訊閱讀(765) 評論(0)

最后的人機(jī)圍棋大戰(zhàn)，柯潔能否一勝？

　　直到最后一刻，20歲的柯潔都在努力去贏對手人工智能AlphaGo一盤棋?？聺嵤侵袊鴩迓殬I(yè)九段棋手，現(xiàn)今圍棋等級分排名世界第一。

　　2017年5月25日下午1點(diǎn)37分時(shí)，浙江烏鎮(zhèn)，柯潔將三顆白子撂在黃棋盤上認(rèn)輸，來不及整理一下吃敗仗后的沮喪表情，立刻與對手開始復(fù)盤。兩天前的同一個場地，他已經(jīng)輸了第一盤，按照賽前規(guī)定，此番認(rèn)輸表示整個比賽，三決兩勝，他已經(jīng)輸?shù)袅苏麄€比賽。

　　但是，接下來新聞發(fā)布會上，柯潔當(dāng)著眾多記者的面，向AlphaGo研發(fā)公司Deepmind負(fù)責(zé)人哈薩比斯?fàn)幦∽詈笠槐P對抗執(zhí)白棋權(quán)益。按照之前猜先規(guī)矩，第一盤柯潔執(zhí)黑，第二盤執(zhí)白，第三盤應(yīng)該執(zhí)黑。業(yè)界知道，柯潔執(zhí)白棋勝率遠(yuǎn)高于黑棋。

　　按照本次圍棋峰會日程，26日舉行配對賽和中國圍棋五人團(tuán)隊(duì)與AlphaGo對弈。據(jù)現(xiàn)場解說員、柯潔朋友古力透露，柯潔提出想成為這場對抗賽的擺棋“人肉臂”，被主辦方拒絕。顯然，這位人類圍棋“代表”者柯潔，一直在爭取點(diǎn)滴機(jī)會多了解對手AlphaGo。

　　26日當(dāng)天舉行的配對賽和團(tuán)隊(duì)對弈AlphaGo，柯潔雖然沒有作為選手登場，也沒有像第一場失利之后去池塘釣魚、拉弓射箭，而是一直泡在后方研究室里，關(guān)注場上比賽變化。據(jù)AlphaGo官方團(tuán)隊(duì)證實(shí)，柯潔當(dāng)天下午觀看中國五人團(tuán)體對戰(zhàn)AlphaGo過程中，首先在一步棋上提出了靠完尖的下法，被其他棋手嘲笑否定。不久之后，AlphaGo使出了一模一樣的著法。

　　某種程度上，柯潔是在為人類棋手而戰(zhàn)，也是在為自己而戰(zhàn)。2016年3月，AlphaGo在韓國首爾與李世石對戰(zhàn)五局中，輸?shù)舻谒木?。李世石成為目前?zhàn)勝過人工智能AlphaGo的最后一人。如果柯潔不能勝一盤AlphaGo，歷史將會像記住戰(zhàn)勝過IBM深藍(lán)電腦的國際象棋冠軍卡斯帕羅夫、第一個登月的阿姆斯特朗一樣記住李世石，而不是柯潔。

　　兩次與現(xiàn)場預(yù)判相反的逆轉(zhuǎn)

　　從最初看不上眼，到贏了韓國棋手李世石之后被震驚，再到稱呼AlphaGo為“阿老師”，圍棋手們在不斷地調(diào)整著對于人工智能最新代表者AlphaGo的認(rèn)知。峰會上，最讓中國棋手們渴望和興奮的是試圖找到AlphaGo一些破綻。

　　中國圍棋隊(duì)總教練俞斌此前表示，AlphaGo的弱點(diǎn)，在去年對李世石第四盤中所表現(xiàn)出來的“無中生有”的失誤，當(dāng)李世石下出第78手妙棋之后，AlphaGo開始失常。他將這種失誤稱為“開放性計(jì)算的誤算”。這種誤算在AlphaGo對李世石第五局的角上計(jì)算也出現(xiàn)過。

　　人們覺得AlphaGo是電腦，擅長計(jì)算，可能不擅長從大局考慮。經(jīng)過幾番對戰(zhàn)，棋手們推翻了此前判斷，他們發(fā)現(xiàn)AlphaGo駕馭大局能力并不比人類弱，很難從中占到便宜。又有人大膽提出，AlphaGo可能擅長布局，不擅長計(jì)算;還有人提出AlphaGo下棋，重?fù)茖?shí)地，不重形勢。像盲目摸象，人類棋手不停地嘗試著。

　　另外，有棋手們推斷，人工智能圍棋經(jīng)常走棋時(shí)刪繁就簡，不造劫材，可能不擅長“應(yīng)劫”，多多打劫可能會讓電腦犯糊涂，并舉出網(wǎng)上一些贏了AI圍棋的例子證明，不斷挑起肉搏，在亂戰(zhàn)中尋找機(jī)會殺死AI圍棋大龍方才有獲勝機(jī)會。

　　以上這些因暫時(shí)沒有人類戰(zhàn)勝AlphaGo和今年初AlphaGo匿名化身的Master，無從證明。

　　倒是現(xiàn)場解說員，對于棋盤上勝負(fù)預(yù)期兩次與最終AlphaGo走出的結(jié)果完全相反，著實(shí)讓現(xiàn)場的觀眾和解說員一起好久難以緩過勁來。

　　第一次來自柯潔25日與AlphaGo的第二場比賽。開局至前100手，棋手古力九段根據(jù)柯潔臉上表情、較少揪頭發(fā)的動作和棋盤上局勢得出柯潔的棋相當(dāng)樂觀，有獲勝的希望。“AlphaGo之父”哈薩比斯(Demis Hassabis)在11：32通過社交網(wǎng)絡(luò)對外稱：“根據(jù)AlphaGo的評估，柯潔此時(shí)此刻下的非常完美。”當(dāng)時(shí)比賽還在進(jìn)行當(dāng)中，這條推文截圖立刻在現(xiàn)場傳播。觀眾有些興奮，期待柯潔代表人類給機(jī)器一個教訓(xùn)。

　　這個希望隨著柯潔投子認(rèn)輸而泯滅。

　　第二次是26日上午連笑+AlphaGo一起對戰(zhàn)古力+AlphaGo，現(xiàn)場氣氛隨著解說員引導(dǎo)，認(rèn)為時(shí)間相對充裕的古力一方勝券在握。結(jié)果卻是古力一方AlphaGo主動投降，古力拒絕，下了十來手之后，古力認(rèn)識到大勢已去，親自舉起投降牌子。

　　賽后，騰訊科技追隨著一名現(xiàn)場解說員問為何出現(xiàn)逆轉(zhuǎn)情況、AlphaGo和古力誰下出惡手等問題，此位解說員思緒一直停留在比賽中，難以回神應(yīng)答。

　　AlphaGo帶給人類圍棋界的震驚仍然在繼續(xù)，并擴(kuò)大著影響范圍。只是很多人現(xiàn)場見證之后，感受更為深刻——很多人是懵的，包括職業(yè)棋手和一些專家。

　　這或許意味著，在遠(yuǎn)超人類計(jì)算能力的人工智能AlphaGo面前，職業(yè)棋手與業(yè)余棋手之間的差距，可能沒有職業(yè)棋手與AlphaGo之間差距大，整個圍棋界將因?yàn)锳lphaGo的存在引起一些固有結(jié)構(gòu)的崩塌。這之后，誰能有與AlphaGo切磋棋藝的機(jī)會，誰就有可能更快地成長，走得更遠(yuǎn)。

　　更強(qiáng)的AlphaGo

　　如果烏鎮(zhèn)峰會上柯潔勝一局，意義將不同于去年李世石取勝。

　　5月24日，在新版本AlphaGo首戰(zhàn)以1/4子優(yōu)勢戰(zhàn)勝柯潔之后，DeepMind創(chuàng)始人兼CEO 哈薩比斯、AlphaGo團(tuán)隊(duì)負(fù)責(zé)人David Silver在人工智能高峰論壇上稱，“AlphaGo已經(jīng)可以模仿人類直覺。在過去一年，我們想打造完美的AlphaGo，彌補(bǔ)它知識方面的空白。因?yàn)樵谂c李世石的比賽中，它是有缺陷的。”哈薩比斯說。據(jù)介紹，AlphaGo升級后新版本可以讓老版本三個子。

　　哈薩比斯稱圍棋因?yàn)樘^復(fù)雜，窮舉搜索難以解決。對于計(jì)算機(jī)來說，圍棋有兩項(xiàng)難題：很難寫出評估程序以決定誰贏;搜索空間太過龐大。

　　圍棋不像象棋等游戲靠計(jì)算，而是靠直覺。圍棋中沒有等級概念，所有棋子都一樣。圍棋是筑防游戲，因此需要盤算未來。為此，AlphaGo團(tuán)隊(duì)用兩種卷積神經(jīng)網(wǎng)絡(luò)去完成：策略網(wǎng)絡(luò)和估值網(wǎng)絡(luò)。策略網(wǎng)絡(luò)的卷積神經(jīng)網(wǎng)絡(luò)用于決定下一步落子可能的位置，價(jià)值網(wǎng)絡(luò)用于評估當(dāng)前棋局獲勝的概率。

　　為了應(yīng)對圍棋巨大復(fù)雜性，AlphaGo 采用機(jī)器學(xué)習(xí)技術(shù)，結(jié)合了監(jiān)督學(xué)習(xí)和強(qiáng)化學(xué)習(xí)的優(yōu)勢。通過訓(xùn)練形成一個策略網(wǎng)絡(luò)(policy network)，將棋盤上的局勢作為輸入信息，并對所有可行的落子位置生成一個概率分布。

最后的人機(jī)圍棋大戰(zhàn)，柯潔能否一勝？

　　然后，訓(xùn)練出一個價(jià)值網(wǎng)絡(luò)(value network)對自我對弈進(jìn)行預(yù)測，以 -1(對手的絕對勝利)到1(AlphaGo的絕對勝利)的標(biāo)準(zhǔn)，預(yù)測所有可行落子位置的結(jié)果。這兩個網(wǎng)絡(luò)自身都十分強(qiáng)大，而 AlphaGo將這兩種網(wǎng)絡(luò)整合進(jìn)基于概率的蒙特卡羅樹搜索(MCTS)中，實(shí)現(xiàn)了它真正的優(yōu)勢。最后，新版的AlphaGo 產(chǎn)生大量自我對弈棋局，為下一代版本提供了訓(xùn)練數(shù)據(jù)，此過程循環(huán)往復(fù)。

　　地平線創(chuàng)始人、百度前深度學(xué)習(xí)研究院負(fù)責(zé)人余凱告訴騰訊科技，這次AlphaGo來到中國，技術(shù)提升的進(jìn)步體現(xiàn)在兩方面，一方面是AlphaGo 2.0算法，更多強(qiáng)調(diào)通過自我博弈，加上通過學(xué)習(xí)人類棋手的歷史數(shù)據(jù)提升棋藝，一般來說，人工智能需要大數(shù)據(jù)，而AlphaGo這種做法，并不需要那么多大數(shù)據(jù)，從零開始，提升棋藝。“我覺得這具有革命性意義。”

　　另一方面，Deepmind母公司自己研發(fā)的新型架構(gòu)處理器TPU的使用，做到了AlphaGo“單機(jī)版”，進(jìn)一步減少了對處理器數(shù)量的需求。

　　曾經(jīng)，人工智能學(xué)界認(rèn)為傳統(tǒng)硬件很難進(jìn)一步提升AlphaGo棋力。去年李世石與AlphaGo開戰(zhàn)之前，創(chuàng)新工場創(chuàng)辦者李開復(fù)(微博)在知乎上撰文說明，下圍棋計(jì)算，需要增加硬件。線性地從1202個CPU增加到1920個CPU，AlphaGo的技戰(zhàn)指數(shù)(ELO)只增加了28，并未跟著跳躍增長。

　　但是，TPU的出現(xiàn)極大地提高了計(jì)算性能，同時(shí)能耗更小，體積也更小。余凱認(rèn)為通過TPU加大的計(jì)算能力，硬件能力提升使得搜索進(jìn)入一個更大的求解空間。“硬件提升也是令業(yè)界矚目的。”

　　國內(nèi)人工智能芯片研發(fā)公司寒武紀(jì)曾預(yù)言，采用人工智能芯片，AlphaGo只需要一臺個人電腦大小的主機(jī)。這次烏鎮(zhèn)圍棋峰會上，雖然Deepmind公司未能完全達(dá)到，卻朝這個方面在進(jìn)步。值得一提的是，寒武紀(jì)公司創(chuàng)始人陳天石告訴騰訊科技，早期與一位法國專家Olivier Temam一起研究人工智能芯片，這位法國人后來加入了Deepmind的母公司，成為TPU團(tuán)隊(duì)中一員。

　　未來，更強(qiáng)的人工智能芯片的出現(xiàn)，與人類棋手的水平將越拉越遠(yuǎn)。

　　逼至AIpahGo極限的比賽

　　一方面人類棋手在尋找機(jī)會戰(zhàn)勝AlphaGo，另一方面，節(jié)節(jié)勝利的AlphaGo正在被神化。

　　在峰會現(xiàn)場，騰訊科技發(fā)現(xiàn)一個有趣現(xiàn)象。作為AlphaGo的核心人物之一，黃士杰博士充當(dāng)機(jī)械臂擺放棋子，整個比賽過程中通常面無表情，不上廁所、不喝水。不斷吃敗仗之后，人們開始談?wù)擖S的表情，甚至開始探究黃擺放棋子的手勢，用大拇指和用中指是否代表著不同心情。

　　本次烏鎮(zhèn)圍棋峰會之前，柯潔究竟研究了多少盤AlphaGo曾走過的棋?無人知曉。人們注意到，柯潔在與AlphaGo對局時(shí)，已經(jīng)可以熟練運(yùn)用由AlphaGo采用的一些棋招。

　　最常被人舉例的是所謂“點(diǎn)三三”走法。在對手先手占據(jù)星位時(shí)，自己再從三三路位置打入。擱在AlphaGo之前，下棋者使用此辦法，“會被老師打屁股，甚至?xí)徽J(rèn)為不會下棋”，不僅一位棋手說。但是，從去年底和今年初AlphaGo大量應(yīng)用此招，并取得勝利之后，圍棋界對“點(diǎn)三三”做法重新評估?，F(xiàn)在普遍持星位和三三位互為弱點(diǎn)，充滿辯證意味。

　　人與機(jī)器對弈中，人類開始借鑒學(xué)習(xí)人工智能。

　　23日，柯潔第一盤棋輸?shù)羲姆种蛔?，屬于穩(wěn)扎穩(wěn)打下法。25日，柯潔明顯換了一種風(fēng)格，他試圖與AlphaGo激烈對抗，制造更多紛爭。一度，在左下角的一塊棋有劫爭，AlphaGo遲遲不能像慣常做法那樣化繁就簡，“撐在那里”。盤面最復(fù)雜時(shí)，有七八條大龍?jiān)谙嗷ソg殺糾纏，盤面充滿不確實(shí)性。

　　這是柯潔最興奮的時(shí)刻，后來也被證明是他離勝利最近的時(shí)刻。當(dāng)時(shí)，他用手撫了撫心臟。“太緊張的緣故，想讓它跳得慢一點(diǎn)”，柯潔在賽后發(fā)布回顧當(dāng)時(shí)下棋感覺。

　　“柯潔在這場比賽中是有很多的機(jī)會。”哈薩比斯說：“前100步是目前為止和AlphaGo下得最勢均力敵的人。”他稱柯潔比賽中一度將AlphaGo逼至了極限。

　　遺憾的是，“興奮之后出現(xiàn)了失誤”，柯潔事后坦承未能克服人類的情緒弱點(diǎn)。有情感的人類與只知勝負(fù)概率的AlphaGo之間究竟不是同一物種。

　　現(xiàn)在看來，人類或有可能因?yàn)锳lphaGo的棋路和棋譜，挖掘出圍棋更多的、沒有被人類探索和理解的地方，利用得當(dāng)，會使目前圍棋整體水平再上一個臺階。重慶人工智能公司云叢科技創(chuàng)始人周曦持此觀點(diǎn)。他對騰訊科技分析說，AlphaGo下了很多人類理解不了的棋，打破了人類圍棋思維定勢，使得人類棋手更多的反思和學(xué)習(xí)。同樣的，人的學(xué)習(xí)抽象理解能力，也不是AlphaGo能掌握的。

　　未來是否會開放AlphaGo給所有的圍棋愛好者?戰(zhàn)勝人類棋力最強(qiáng)的柯潔之后，下一次還會舉辦此類圍棋峰會嗎?對于騰訊科技這些問題，AlphaGo方面核心人員之一David Silver避重就輕地給予了回答，“AlphaGo只是作為研究為主，沒有進(jìn)一步計(jì)劃。”

　　不過，有一點(diǎn)可以肯定，當(dāng)人工智能的圍棋水平遠(yuǎn)遠(yuǎn)勝過人類之后，人類將放棄繼續(xù)挑戰(zhàn)機(jī)器的狂想，就像今天人們已經(jīng)習(xí)慣普通電子計(jì)算器，誰也不會與它爭一爭計(jì)算加減乘除運(yùn)算速度。也許，到那時(shí)回頭看，本次烏鎮(zhèn)圍棋峰會可能是人機(jī)大戰(zhàn)歷程中最后一個峰會。

贊(0)

標(biāo)簽：AI CPU master word 人工智能處理器大數(shù)據(jù)微博電腦百度社交網(wǎng)絡(luò)騰訊計(jì)算機(jī)論壇韓國首爾

相關(guān)推薦

網(wǎng)站地圖滬ICP備18035694號-2

滬公網(wǎng)安備31011702889846號