久久久久久久视色,久久电影免费精品,中文亚洲欧美乱码在线观看,在线免费播放AV片

<center id="vfaef"><input id="vfaef"><table id="vfaef"></table></input></center>

    <p id="vfaef"><kbd id="vfaef"></kbd></p>

    
    
    <pre id="vfaef"><u id="vfaef"></u></pre>

      <thead id="vfaef"><input id="vfaef"></input></thead>

    1. 站長(zhǎng)資訊網(wǎng)
      最全最豐富的資訊網(wǎng)站

      最后的人機(jī)圍棋大戰(zhàn),柯潔能否一勝?

      最后的人機(jī)圍棋大戰(zhàn),柯潔能否一勝?

        直到最后一刻,20歲的柯潔都在努力去贏對(duì)手人工智能AlphaGo一盤(pán)棋??聺嵤侵袊?guó)圍棋職業(yè)九段棋手,現(xiàn)今圍棋等級(jí)分排名世界第一。

        2017年5月25日下午1點(diǎn)37分時(shí),浙江烏鎮(zhèn),柯潔將三顆白子撂在黃棋盤(pán)上認(rèn)輸,來(lái)不及整理一下吃敗仗后的沮喪表情,立刻與對(duì)手開(kāi)始復(fù)盤(pán)。兩天前的同一個(gè)場(chǎng)地,他已經(jīng)輸了第一盤(pán),按照賽前規(guī)定,此番認(rèn)輸表示整個(gè)比賽,三決兩勝,他已經(jīng)輸?shù)袅苏麄€(gè)比賽。

        但是,接下來(lái)新聞發(fā)布會(huì)上,柯潔當(dāng)著眾多記者的面,向AlphaGo研發(fā)公司Deepmind負(fù)責(zé)人哈薩比斯?fàn)幦∽詈笠槐P(pán)對(duì)抗執(zhí)白棋權(quán)益。按照之前猜先規(guī)矩,第一盤(pán)柯潔執(zhí)黑,第二盤(pán)執(zhí)白,第三盤(pán)應(yīng)該執(zhí)黑。業(yè)界知道,柯潔執(zhí)白棋勝率遠(yuǎn)高于黑棋。

        按照本次圍棋峰會(huì)日程,26日舉行配對(duì)賽和中國(guó)圍棋五人團(tuán)隊(duì)與AlphaGo對(duì)弈。據(jù)現(xiàn)場(chǎng)解說(shuō)員、柯潔朋友古力透露,柯潔提出想成為這場(chǎng)對(duì)抗賽的擺棋“人肉臂”,被主辦方拒絕。顯然,這位人類(lèi)圍棋“代表”者柯潔,一直在爭(zhēng)取點(diǎn)滴機(jī)會(huì)多了解對(duì)手AlphaGo。

        26日當(dāng)天舉行的配對(duì)賽和團(tuán)隊(duì)對(duì)弈AlphaGo,柯潔雖然沒(méi)有作為選手登場(chǎng),也沒(méi)有像第一場(chǎng)失利之后去池塘釣魚(yú)、拉弓射箭,而是一直泡在后方研究室里,關(guān)注場(chǎng)上比賽變化。據(jù)AlphaGo官方團(tuán)隊(duì)證實(shí),柯潔當(dāng)天下午觀(guān)看中國(guó)五人團(tuán)體對(duì)戰(zhàn)AlphaGo過(guò)程中,首先在一步棋上提出了靠完尖的下法,被其他棋手嘲笑否定。不久之后,AlphaGo使出了一模一樣的著法。

        某種程度上,柯潔是在為人類(lèi)棋手而戰(zhàn),也是在為自己而戰(zhàn)。2016年3月,AlphaGo在韓國(guó)首爾與李世石對(duì)戰(zhàn)五局中,輸?shù)舻谒木?。李世石成為目前?zhàn)勝過(guò)人工智能AlphaGo的最后一人。如果柯潔不能勝一盤(pán)AlphaGo,歷史將會(huì)像記住戰(zhàn)勝過(guò)IBM深藍(lán)電腦的國(guó)際象棋冠軍卡斯帕羅夫、第一個(gè)登月的阿姆斯特朗一樣記住李世石,而不是柯潔。

        兩次與現(xiàn)場(chǎng)預(yù)判相反的逆轉(zhuǎn)

        從最初看不上眼,到贏了韓國(guó)棋手李世石之后被震驚,再到稱(chēng)呼AlphaGo為“阿老師”,圍棋手們?cè)诓粩嗟卣{(diào)整著對(duì)于人工智能最新代表者AlphaGo的認(rèn)知。峰會(huì)上,最讓中國(guó)棋手們渴望和興奮的是試圖找到AlphaGo一些破綻。

        中國(guó)圍棋隊(duì)總教練俞斌此前表示,AlphaGo的弱點(diǎn),在去年對(duì)李世石第四盤(pán)中所表現(xiàn)出來(lái)的“無(wú)中生有”的失誤,當(dāng)李世石下出第78手妙棋之后,AlphaGo開(kāi)始失常。他將這種失誤稱(chēng)為“開(kāi)放性計(jì)算的誤算”。這種誤算在AlphaGo對(duì)李世石第五局的角上計(jì)算也出現(xiàn)過(guò)。

        人們覺(jué)得AlphaGo是電腦,擅長(zhǎng)計(jì)算,可能不擅長(zhǎng)從大局考慮。經(jīng)過(guò)幾番對(duì)戰(zhàn),棋手們推翻了此前判斷,他們發(fā)現(xiàn)AlphaGo駕馭大局能力并不比人類(lèi)弱,很難從中占到便宜。又有人大膽提出,AlphaGo可能擅長(zhǎng)布局,不擅長(zhǎng)計(jì)算;還有人提出AlphaGo下棋,重?fù)茖?shí)地,不重形勢(shì)。像盲目摸象,人類(lèi)棋手不停地嘗試著。

        另外,有棋手們推斷,人工智能?chē)褰?jīng)常走棋時(shí)刪繁就簡(jiǎn),不造劫材,可能不擅長(zhǎng)“應(yīng)劫”,多多打劫可能會(huì)讓電腦犯糊涂,并舉出網(wǎng)上一些贏了AI圍棋的例子證明,不斷挑起肉搏,在亂戰(zhàn)中尋找機(jī)會(huì)殺死AI圍棋大龍方才有獲勝機(jī)會(huì)。

        以上這些因暫時(shí)沒(méi)有人類(lèi)戰(zhàn)勝AlphaGo和今年初AlphaGo匿名化身的Master,無(wú)從證明。

        倒是現(xiàn)場(chǎng)解說(shuō)員,對(duì)于棋盤(pán)上勝負(fù)預(yù)期兩次與最終AlphaGo走出的結(jié)果完全相反,著實(shí)讓現(xiàn)場(chǎng)的觀(guān)眾和解說(shuō)員一起好久難以緩過(guò)勁來(lái)。

        第一次來(lái)自柯潔25日與AlphaGo的第二場(chǎng)比賽。開(kāi)局至前100手,棋手古力九段根據(jù)柯潔臉上表情、較少揪頭發(fā)的動(dòng)作和棋盤(pán)上局勢(shì)得出柯潔的棋相當(dāng)樂(lè)觀(guān),有獲勝的希望。“AlphaGo之父”哈薩比斯(Demis Hassabis)在11:32通過(guò)社交網(wǎng)絡(luò)對(duì)外稱(chēng):“根據(jù)AlphaGo的評(píng)估,柯潔此時(shí)此刻下的非常完美。”當(dāng)時(shí)比賽還在進(jìn)行當(dāng)中,這條推文截圖立刻在現(xiàn)場(chǎng)傳播。觀(guān)眾有些興奮,期待柯潔代表人類(lèi)給機(jī)器一個(gè)教訓(xùn)。

        這個(gè)希望隨著柯潔投子認(rèn)輸而泯滅。

        第二次是26日上午連笑+AlphaGo一起對(duì)戰(zhàn)古力+AlphaGo,現(xiàn)場(chǎng)氣氛隨著解說(shuō)員引導(dǎo),認(rèn)為時(shí)間相對(duì)充裕的古力一方勝券在握。結(jié)果卻是古力一方AlphaGo主動(dòng)投降,古力拒絕,下了十來(lái)手之后,古力認(rèn)識(shí)到大勢(shì)已去,親自舉起投降牌子。

        賽后,騰訊科技追隨著一名現(xiàn)場(chǎng)解說(shuō)員問(wèn)為何出現(xiàn)逆轉(zhuǎn)情況、AlphaGo和古力誰(shuí)下出惡手等問(wèn)題,此位解說(shuō)員思緒一直停留在比賽中,難以回神應(yīng)答。

        AlphaGo帶給人類(lèi)圍棋界的震驚仍然在繼續(xù),并擴(kuò)大著影響范圍。只是很多人現(xiàn)場(chǎng)見(jiàn)證之后,感受更為深刻——很多人是懵的,包括職業(yè)棋手和一些專(zhuān)家。

        這或許意味著,在遠(yuǎn)超人類(lèi)計(jì)算能力的人工智能AlphaGo面前,職業(yè)棋手與業(yè)余棋手之間的差距,可能沒(méi)有職業(yè)棋手與AlphaGo之間差距大,整個(gè)圍棋界將因?yàn)锳lphaGo的存在引起一些固有結(jié)構(gòu)的崩塌。這之后,誰(shuí)能有與AlphaGo切磋棋藝的機(jī)會(huì),誰(shuí)就有可能更快地成長(zhǎng),走得更遠(yuǎn)。

        更強(qiáng)的AlphaGo

        如果烏鎮(zhèn)峰會(huì)上柯潔勝一局,意義將不同于去年李世石取勝。

        5月24日,在新版本AlphaGo首戰(zhàn)以1/4子優(yōu)勢(shì)戰(zhàn)勝柯潔之后,DeepMind創(chuàng)始人兼CEO 哈薩比斯、AlphaGo團(tuán)隊(duì)負(fù)責(zé)人David Silver在人工智能高峰論壇上稱(chēng),“AlphaGo已經(jīng)可以模仿人類(lèi)直覺(jué)。在過(guò)去一年,我們想打造完美的AlphaGo,彌補(bǔ)它知識(shí)方面的空白。因?yàn)樵谂c李世石的比賽中,它是有缺陷的。”哈薩比斯說(shuō)。據(jù)介紹,AlphaGo升級(jí)后新版本可以讓老版本三個(gè)子。

        哈薩比斯稱(chēng)圍棋因?yàn)樘^(guò)復(fù)雜,窮舉搜索難以解決。對(duì)于計(jì)算機(jī)來(lái)說(shuō),圍棋有兩項(xiàng)難題:很難寫(xiě)出評(píng)估程序以決定誰(shuí)贏;搜索空間太過(guò)龐大。

        圍棋不像象棋等游戲靠計(jì)算,而是靠直覺(jué)。圍棋中沒(méi)有等級(jí)概念,所有棋子都一樣。圍棋是筑防游戲,因此需要盤(pán)算未來(lái)。為此,AlphaGo團(tuán)隊(duì)用兩種卷積神經(jīng)網(wǎng)絡(luò)去完成:策略網(wǎng)絡(luò)和估值網(wǎng)絡(luò)。策略網(wǎng)絡(luò)的卷積神經(jīng)網(wǎng)絡(luò)用于決定下一步落子可能的位置,價(jià)值網(wǎng)絡(luò)用于評(píng)估當(dāng)前棋局獲勝的概率。

        為了應(yīng)對(duì)圍棋巨大復(fù)雜性,AlphaGo 采用機(jī)器學(xué)習(xí)技術(shù),結(jié)合了監(jiān)督學(xué)習(xí)和強(qiáng)化學(xué)習(xí)的優(yōu)勢(shì)。通過(guò)訓(xùn)練形成一個(gè)策略網(wǎng)絡(luò)(policy network),將棋盤(pán)上的局勢(shì)作為輸入信息,并對(duì)所有可行的落子位置生成一個(gè)概率分布。

      最后的人機(jī)圍棋大戰(zhàn),柯潔能否一勝?

        然后,訓(xùn)練出一個(gè)價(jià)值網(wǎng)絡(luò)(value network)對(duì)自我對(duì)弈進(jìn)行預(yù)測(cè),以 -1(對(duì)手的絕對(duì)勝利)到1(AlphaGo的絕對(duì)勝利)的標(biāo)準(zhǔn),預(yù)測(cè)所有可行落子位置的結(jié)果。這兩個(gè)網(wǎng)絡(luò)自身都十分強(qiáng)大,而 AlphaGo將這兩種網(wǎng)絡(luò)整合進(jìn)基于概率的蒙特卡羅樹(shù)搜索(MCTS)中,實(shí)現(xiàn)了它真正的優(yōu)勢(shì)。最后,新版的AlphaGo 產(chǎn)生大量自我對(duì)弈棋局,為下一代版本提供了訓(xùn)練數(shù)據(jù),此過(guò)程循環(huán)往復(fù)。

        地平線(xiàn)創(chuàng)始人、百度前深度學(xué)習(xí)研究院負(fù)責(zé)人余凱告訴騰訊科技,這次AlphaGo來(lái)到中國(guó),技術(shù)提升的進(jìn)步體現(xiàn)在兩方面,一方面是AlphaGo 2.0算法,更多強(qiáng)調(diào)通過(guò)自我博弈,加上通過(guò)學(xué)習(xí)人類(lèi)棋手的歷史數(shù)據(jù)提升棋藝,一般來(lái)說(shuō),人工智能需要大數(shù)據(jù),而AlphaGo這種做法,并不需要那么多大數(shù)據(jù),從零開(kāi)始,提升棋藝。“我覺(jué)得這具有革命性意義。”

        另一方面,Deepmind母公司自己研發(fā)的新型架構(gòu)處理器TPU的使用,做到了AlphaGo“單機(jī)版”,進(jìn)一步減少了對(duì)處理器數(shù)量的需求。

        曾經(jīng),人工智能學(xué)界認(rèn)為傳統(tǒng)硬件很難進(jìn)一步提升AlphaGo棋力。去年李世石與AlphaGo開(kāi)戰(zhàn)之前,創(chuàng)新工場(chǎng)創(chuàng)辦者李開(kāi)復(fù)(微博)在知乎上撰文說(shuō)明,下圍棋計(jì)算,需要增加硬件。線(xiàn)性地從1202個(gè)CPU增加到1920個(gè)CPU,AlphaGo的技戰(zhàn)指數(shù)(ELO)只增加了28,并未跟著跳躍增長(zhǎng)。

        但是,TPU的出現(xiàn)極大地提高了計(jì)算性能,同時(shí)能耗更小,體積也更小。余凱認(rèn)為通過(guò)TPU加大的計(jì)算能力,硬件能力提升使得搜索進(jìn)入一個(gè)更大的求解空間。“硬件提升也是令業(yè)界矚目的。”

        國(guó)內(nèi)人工智能芯片研發(fā)公司寒武紀(jì)曾預(yù)言,采用人工智能芯片,AlphaGo只需要一臺(tái)個(gè)人電腦大小的主機(jī)。這次烏鎮(zhèn)圍棋峰會(huì)上,雖然Deepmind公司未能完全達(dá)到,卻朝這個(gè)方面在進(jìn)步。值得一提的是,寒武紀(jì)公司創(chuàng)始人陳天石告訴騰訊科技,早期與一位法國(guó)專(zhuān)家Olivier Temam一起研究人工智能芯片,這位法國(guó)人后來(lái)加入了Deepmind的母公司,成為T(mén)PU團(tuán)隊(duì)中一員。

        未來(lái),更強(qiáng)的人工智能芯片的出現(xiàn),與人類(lèi)棋手的水平將越拉越遠(yuǎn)。

        逼至AIpahGo極限的比賽

        一方面人類(lèi)棋手在尋找機(jī)會(huì)戰(zhàn)勝AlphaGo,另一方面,節(jié)節(jié)勝利的AlphaGo正在被神化。

        在峰會(huì)現(xiàn)場(chǎng),騰訊科技發(fā)現(xiàn)一個(gè)有趣現(xiàn)象。作為AlphaGo的核心人物之一,黃士杰博士充當(dāng)機(jī)械臂擺放棋子,整個(gè)比賽過(guò)程中通常面無(wú)表情,不上廁所、不喝水。不斷吃敗仗之后,人們開(kāi)始談?wù)擖S的表情,甚至開(kāi)始探究黃擺放棋子的手勢(shì),用大拇指和用中指是否代表著不同心情。

        本次烏鎮(zhèn)圍棋峰會(huì)之前,柯潔究竟研究了多少盤(pán)AlphaGo曾走過(guò)的棋?無(wú)人知曉。人們注意到,柯潔在與AlphaGo對(duì)局時(shí),已經(jīng)可以熟練運(yùn)用由AlphaGo采用的一些棋招。

        最常被人舉例的是所謂“點(diǎn)三三”走法。在對(duì)手先手占據(jù)星位時(shí),自己再?gòu)娜肺恢么蛉?。擱在AlphaGo之前,下棋者使用此辦法,“會(huì)被老師打屁股,甚至?xí)徽J(rèn)為不會(huì)下棋”,不僅一位棋手說(shuō)。但是,從去年底和今年初AlphaGo大量應(yīng)用此招,并取得勝利之后,圍棋界對(duì)“點(diǎn)三三”做法重新評(píng)估。現(xiàn)在普遍持星位和三三位互為弱點(diǎn),充滿(mǎn)辯證意味。

        人與機(jī)器對(duì)弈中,人類(lèi)開(kāi)始借鑒學(xué)習(xí)人工智能。

        23日,柯潔第一盤(pán)棋輸?shù)羲姆种蛔樱瑢儆诜€(wěn)扎穩(wěn)打下法。25日,柯潔明顯換了一種風(fēng)格,他試圖與AlphaGo激烈對(duì)抗,制造更多紛爭(zhēng)。一度,在左下角的一塊棋有劫爭(zhēng),AlphaGo遲遲不能像慣常做法那樣化繁就簡(jiǎn),“撐在那里”。盤(pán)面最復(fù)雜時(shí),有七八條大龍?jiān)谙嗷ソg殺糾纏,盤(pán)面充滿(mǎn)不確實(shí)性。

        這是柯潔最興奮的時(shí)刻,后來(lái)也被證明是他離勝利最近的時(shí)刻。當(dāng)時(shí),他用手撫了撫心臟。“太緊張的緣故,想讓它跳得慢一點(diǎn)”,柯潔在賽后發(fā)布回顧當(dāng)時(shí)下棋感覺(jué)。

        “柯潔在這場(chǎng)比賽中是有很多的機(jī)會(huì)。”哈薩比斯說(shuō):“前100步是目前為止和AlphaGo下得最勢(shì)均力敵的人。”他稱(chēng)柯潔比賽中一度將AlphaGo逼至了極限。

        遺憾的是,“興奮之后出現(xiàn)了失誤”,柯潔事后坦承未能克服人類(lèi)的情緒弱點(diǎn)。有情感的人類(lèi)與只知?jiǎng)儇?fù)概率的AlphaGo之間究竟不是同一物種。

        現(xiàn)在看來(lái),人類(lèi)或有可能因?yàn)锳lphaGo的棋路和棋譜,挖掘出圍棋更多的、沒(méi)有被人類(lèi)探索和理解的地方,利用得當(dāng),會(huì)使目前圍棋整體水平再上一個(gè)臺(tái)階。重慶人工智能公司云叢科技創(chuàng)始人周曦持此觀(guān)點(diǎn)。他對(duì)騰訊科技分析說(shuō),AlphaGo下了很多人類(lèi)理解不了的棋,打破了人類(lèi)圍棋思維定勢(shì),使得人類(lèi)棋手更多的反思和學(xué)習(xí)。同樣的,人的學(xué)習(xí)抽象理解能力,也不是AlphaGo能掌握的。

        未來(lái)是否會(huì)開(kāi)放AlphaGo給所有的圍棋愛(ài)好者?戰(zhàn)勝人類(lèi)棋力最強(qiáng)的柯潔之后,下一次還會(huì)舉辦此類(lèi)圍棋峰會(huì)嗎?對(duì)于騰訊科技這些問(wèn)題,AlphaGo方面核心人員之一David Silver避重就輕地給予了回答,“AlphaGo只是作為研究為主,沒(méi)有進(jìn)一步計(jì)劃。”

        不過(guò),有一點(diǎn)可以肯定,當(dāng)人工智能的圍棋水平遠(yuǎn)遠(yuǎn)勝過(guò)人類(lèi)之后,人類(lèi)將放棄繼續(xù)挑戰(zhàn)機(jī)器的狂想,就像今天人們已經(jīng)習(xí)慣普通電子計(jì)算器,誰(shuí)也不會(huì)與它爭(zhēng)一爭(zhēng)計(jì)算加減乘除運(yùn)算速度。也許,到那時(shí)回頭看,本次烏鎮(zhèn)圍棋峰會(huì)可能是人機(jī)大戰(zhàn)歷程中最后一個(gè)峰會(huì)。

      贊(0)
      分享到: 更多 (0)
      網(wǎng)站地圖   滬ICP備18035694號(hào)-2    滬公網(wǎng)安備31011702889846號(hào)