久久久久久久视色,久久电影免费精品,中文亚洲欧美乱码在线观看,在线免费播放AV片

<center id="vfaef"><input id="vfaef"><table id="vfaef"></table></input></center>

    <p id="vfaef"><kbd id="vfaef"></kbd></p>

    
    
    <pre id="vfaef"><u id="vfaef"></u></pre>

      <thead id="vfaef"><input id="vfaef"></input></thead>

    1. 站長資訊網(wǎng)
      最全最豐富的資訊網(wǎng)站

      最后的人機(jī)圍棋大戰(zhàn),柯潔能否一勝?

      最后的人機(jī)圍棋大戰(zhàn),柯潔能否一勝?

        直到最后一刻,20歲的柯潔都在努力去贏對手人工智能AlphaGo一盤棋??聺嵤侵袊鴩迓殬I(yè)九段棋手,現(xiàn)今圍棋等級分排名世界第一。

        2017年5月25日下午1點(diǎn)37分時(shí),浙江烏鎮(zhèn),柯潔將三顆白子撂在黃棋盤上認(rèn)輸,來不及整理一下吃敗仗后的沮喪表情,立刻與對手開始復(fù)盤。兩天前的同一個場地,他已經(jīng)輸了第一盤,按照賽前規(guī)定,此番認(rèn)輸表示整個比賽,三決兩勝,他已經(jīng)輸?shù)袅苏麄€比賽。

        但是,接下來新聞發(fā)布會上,柯潔當(dāng)著眾多記者的面,向AlphaGo研發(fā)公司Deepmind負(fù)責(zé)人哈薩比斯?fàn)幦∽詈笠槐P對抗執(zhí)白棋權(quán)益。按照之前猜先規(guī)矩,第一盤柯潔執(zhí)黑,第二盤執(zhí)白,第三盤應(yīng)該執(zhí)黑。業(yè)界知道,柯潔執(zhí)白棋勝率遠(yuǎn)高于黑棋。

        按照本次圍棋峰會日程,26日舉行配對賽和中國圍棋五人團(tuán)隊(duì)與AlphaGo對弈。據(jù)現(xiàn)場解說員、柯潔朋友古力透露,柯潔提出想成為這場對抗賽的擺棋“人肉臂”,被主辦方拒絕。顯然,這位人類圍棋“代表”者柯潔,一直在爭取點(diǎn)滴機(jī)會多了解對手AlphaGo。

        26日當(dāng)天舉行的配對賽和團(tuán)隊(duì)對弈AlphaGo,柯潔雖然沒有作為選手登場,也沒有像第一場失利之后去池塘釣魚、拉弓射箭,而是一直泡在后方研究室里,關(guān)注場上比賽變化。據(jù)AlphaGo官方團(tuán)隊(duì)證實(shí),柯潔當(dāng)天下午觀看中國五人團(tuán)體對戰(zhàn)AlphaGo過程中,首先在一步棋上提出了靠完尖的下法,被其他棋手嘲笑否定。不久之后,AlphaGo使出了一模一樣的著法。

        某種程度上,柯潔是在為人類棋手而戰(zhàn),也是在為自己而戰(zhàn)。2016年3月,AlphaGo在韓國首爾與李世石對戰(zhàn)五局中,輸?shù)舻谒木?。李世石成為目前?zhàn)勝過人工智能AlphaGo的最后一人。如果柯潔不能勝一盤AlphaGo,歷史將會像記住戰(zhàn)勝過IBM深藍(lán)電腦的國際象棋冠軍卡斯帕羅夫、第一個登月的阿姆斯特朗一樣記住李世石,而不是柯潔。

        兩次與現(xiàn)場預(yù)判相反的逆轉(zhuǎn)

        從最初看不上眼,到贏了韓國棋手李世石之后被震驚,再到稱呼AlphaGo為“阿老師”,圍棋手們在不斷地調(diào)整著對于人工智能最新代表者AlphaGo的認(rèn)知。峰會上,最讓中國棋手們渴望和興奮的是試圖找到AlphaGo一些破綻。

        中國圍棋隊(duì)總教練俞斌此前表示,AlphaGo的弱點(diǎn),在去年對李世石第四盤中所表現(xiàn)出來的“無中生有”的失誤,當(dāng)李世石下出第78手妙棋之后,AlphaGo開始失常。他將這種失誤稱為“開放性計(jì)算的誤算”。這種誤算在AlphaGo對李世石第五局的角上計(jì)算也出現(xiàn)過。

        人們覺得AlphaGo是電腦,擅長計(jì)算,可能不擅長從大局考慮。經(jīng)過幾番對戰(zhàn),棋手們推翻了此前判斷,他們發(fā)現(xiàn)AlphaGo駕馭大局能力并不比人類弱,很難從中占到便宜。又有人大膽提出,AlphaGo可能擅長布局,不擅長計(jì)算;還有人提出AlphaGo下棋,重?fù)茖?shí)地,不重形勢。像盲目摸象,人類棋手不停地嘗試著。

        另外,有棋手們推斷,人工智能圍棋經(jīng)常走棋時(shí)刪繁就簡,不造劫材,可能不擅長“應(yīng)劫”,多多打劫可能會讓電腦犯糊涂,并舉出網(wǎng)上一些贏了AI圍棋的例子證明,不斷挑起肉搏,在亂戰(zhàn)中尋找機(jī)會殺死AI圍棋大龍方才有獲勝機(jī)會。

        以上這些因暫時(shí)沒有人類戰(zhàn)勝AlphaGo和今年初AlphaGo匿名化身的Master,無從證明。

        倒是現(xiàn)場解說員,對于棋盤上勝負(fù)預(yù)期兩次與最終AlphaGo走出的結(jié)果完全相反,著實(shí)讓現(xiàn)場的觀眾和解說員一起好久難以緩過勁來。

        第一次來自柯潔25日與AlphaGo的第二場比賽。開局至前100手,棋手古力九段根據(jù)柯潔臉上表情、較少揪頭發(fā)的動作和棋盤上局勢得出柯潔的棋相當(dāng)樂觀,有獲勝的希望。“AlphaGo之父”哈薩比斯(Demis Hassabis)在11:32通過社交網(wǎng)絡(luò)對外稱:“根據(jù)AlphaGo的評估,柯潔此時(shí)此刻下的非常完美。”當(dāng)時(shí)比賽還在進(jìn)行當(dāng)中,這條推文截圖立刻在現(xiàn)場傳播。觀眾有些興奮,期待柯潔代表人類給機(jī)器一個教訓(xùn)。

        這個希望隨著柯潔投子認(rèn)輸而泯滅。

        第二次是26日上午連笑+AlphaGo一起對戰(zhàn)古力+AlphaGo,現(xiàn)場氣氛隨著解說員引導(dǎo),認(rèn)為時(shí)間相對充裕的古力一方勝券在握。結(jié)果卻是古力一方AlphaGo主動投降,古力拒絕,下了十來手之后,古力認(rèn)識到大勢已去,親自舉起投降牌子。

        賽后,騰訊科技追隨著一名現(xiàn)場解說員問為何出現(xiàn)逆轉(zhuǎn)情況、AlphaGo和古力誰下出惡手等問題,此位解說員思緒一直停留在比賽中,難以回神應(yīng)答。

        AlphaGo帶給人類圍棋界的震驚仍然在繼續(xù),并擴(kuò)大著影響范圍。只是很多人現(xiàn)場見證之后,感受更為深刻——很多人是懵的,包括職業(yè)棋手和一些專家。

        這或許意味著,在遠(yuǎn)超人類計(jì)算能力的人工智能AlphaGo面前,職業(yè)棋手與業(yè)余棋手之間的差距,可能沒有職業(yè)棋手與AlphaGo之間差距大,整個圍棋界將因?yàn)锳lphaGo的存在引起一些固有結(jié)構(gòu)的崩塌。這之后,誰能有與AlphaGo切磋棋藝的機(jī)會,誰就有可能更快地成長,走得更遠(yuǎn)。

        更強(qiáng)的AlphaGo

        如果烏鎮(zhèn)峰會上柯潔勝一局,意義將不同于去年李世石取勝。

        5月24日,在新版本AlphaGo首戰(zhàn)以1/4子優(yōu)勢戰(zhàn)勝柯潔之后,DeepMind創(chuàng)始人兼CEO 哈薩比斯、AlphaGo團(tuán)隊(duì)負(fù)責(zé)人David Silver在人工智能高峰論壇上稱,“AlphaGo已經(jīng)可以模仿人類直覺。在過去一年,我們想打造完美的AlphaGo,彌補(bǔ)它知識方面的空白。因?yàn)樵谂c李世石的比賽中,它是有缺陷的。”哈薩比斯說。據(jù)介紹,AlphaGo升級后新版本可以讓老版本三個子。

        哈薩比斯稱圍棋因?yàn)樘^復(fù)雜,窮舉搜索難以解決。對于計(jì)算機(jī)來說,圍棋有兩項(xiàng)難題:很難寫出評估程序以決定誰贏;搜索空間太過龐大。

        圍棋不像象棋等游戲靠計(jì)算,而是靠直覺。圍棋中沒有等級概念,所有棋子都一樣。圍棋是筑防游戲,因此需要盤算未來。為此,AlphaGo團(tuán)隊(duì)用兩種卷積神經(jīng)網(wǎng)絡(luò)去完成:策略網(wǎng)絡(luò)和估值網(wǎng)絡(luò)。策略網(wǎng)絡(luò)的卷積神經(jīng)網(wǎng)絡(luò)用于決定下一步落子可能的位置,價(jià)值網(wǎng)絡(luò)用于評估當(dāng)前棋局獲勝的概率。

        為了應(yīng)對圍棋巨大復(fù)雜性,AlphaGo 采用機(jī)器學(xué)習(xí)技術(shù),結(jié)合了監(jiān)督學(xué)習(xí)和強(qiáng)化學(xué)習(xí)的優(yōu)勢。通過訓(xùn)練形成一個策略網(wǎng)絡(luò)(policy network),將棋盤上的局勢作為輸入信息,并對所有可行的落子位置生成一個概率分布。

      最后的人機(jī)圍棋大戰(zhàn),柯潔能否一勝?

        然后,訓(xùn)練出一個價(jià)值網(wǎng)絡(luò)(value network)對自我對弈進(jìn)行預(yù)測,以 -1(對手的絕對勝利)到1(AlphaGo的絕對勝利)的標(biāo)準(zhǔn),預(yù)測所有可行落子位置的結(jié)果。這兩個網(wǎng)絡(luò)自身都十分強(qiáng)大,而 AlphaGo將這兩種網(wǎng)絡(luò)整合進(jìn)基于概率的蒙特卡羅樹搜索(MCTS)中,實(shí)現(xiàn)了它真正的優(yōu)勢。最后,新版的AlphaGo 產(chǎn)生大量自我對弈棋局,為下一代版本提供了訓(xùn)練數(shù)據(jù),此過程循環(huán)往復(fù)。

        地平線創(chuàng)始人、百度前深度學(xué)習(xí)研究院負(fù)責(zé)人余凱告訴騰訊科技,這次AlphaGo來到中國,技術(shù)提升的進(jìn)步體現(xiàn)在兩方面,一方面是AlphaGo 2.0算法,更多強(qiáng)調(diào)通過自我博弈,加上通過學(xué)習(xí)人類棋手的歷史數(shù)據(jù)提升棋藝,一般來說,人工智能需要大數(shù)據(jù),而AlphaGo這種做法,并不需要那么多大數(shù)據(jù),從零開始,提升棋藝。“我覺得這具有革命性意義。”

        另一方面,Deepmind母公司自己研發(fā)的新型架構(gòu)處理器TPU的使用,做到了AlphaGo“單機(jī)版”,進(jìn)一步減少了對處理器數(shù)量的需求。

        曾經(jīng),人工智能學(xué)界認(rèn)為傳統(tǒng)硬件很難進(jìn)一步提升AlphaGo棋力。去年李世石與AlphaGo開戰(zhàn)之前,創(chuàng)新工場創(chuàng)辦者李開復(fù)(微博)在知乎上撰文說明,下圍棋計(jì)算,需要增加硬件。線性地從1202個CPU增加到1920個CPU,AlphaGo的技戰(zhàn)指數(shù)(ELO)只增加了28,并未跟著跳躍增長。

        但是,TPU的出現(xiàn)極大地提高了計(jì)算性能,同時(shí)能耗更小,體積也更小。余凱認(rèn)為通過TPU加大的計(jì)算能力,硬件能力提升使得搜索進(jìn)入一個更大的求解空間。“硬件提升也是令業(yè)界矚目的。”

        國內(nèi)人工智能芯片研發(fā)公司寒武紀(jì)曾預(yù)言,采用人工智能芯片,AlphaGo只需要一臺個人電腦大小的主機(jī)。這次烏鎮(zhèn)圍棋峰會上,雖然Deepmind公司未能完全達(dá)到,卻朝這個方面在進(jìn)步。值得一提的是,寒武紀(jì)公司創(chuàng)始人陳天石告訴騰訊科技,早期與一位法國專家Olivier Temam一起研究人工智能芯片,這位法國人后來加入了Deepmind的母公司,成為TPU團(tuán)隊(duì)中一員。

        未來,更強(qiáng)的人工智能芯片的出現(xiàn),與人類棋手的水平將越拉越遠(yuǎn)。

        逼至AIpahGo極限的比賽

        一方面人類棋手在尋找機(jī)會戰(zhàn)勝AlphaGo,另一方面,節(jié)節(jié)勝利的AlphaGo正在被神化。

        在峰會現(xiàn)場,騰訊科技發(fā)現(xiàn)一個有趣現(xiàn)象。作為AlphaGo的核心人物之一,黃士杰博士充當(dāng)機(jī)械臂擺放棋子,整個比賽過程中通常面無表情,不上廁所、不喝水。不斷吃敗仗之后,人們開始談?wù)擖S的表情,甚至開始探究黃擺放棋子的手勢,用大拇指和用中指是否代表著不同心情。

        本次烏鎮(zhèn)圍棋峰會之前,柯潔究竟研究了多少盤AlphaGo曾走過的棋?無人知曉。人們注意到,柯潔在與AlphaGo對局時(shí),已經(jīng)可以熟練運(yùn)用由AlphaGo采用的一些棋招。

        最常被人舉例的是所謂“點(diǎn)三三”走法。在對手先手占據(jù)星位時(shí),自己再從三三路位置打入。擱在AlphaGo之前,下棋者使用此辦法,“會被老師打屁股,甚至?xí)徽J(rèn)為不會下棋”,不僅一位棋手說。但是,從去年底和今年初AlphaGo大量應(yīng)用此招,并取得勝利之后,圍棋界對“點(diǎn)三三”做法重新評估?,F(xiàn)在普遍持星位和三三位互為弱點(diǎn),充滿辯證意味。

        人與機(jī)器對弈中,人類開始借鑒學(xué)習(xí)人工智能。

        23日,柯潔第一盤棋輸?shù)羲姆种蛔?,屬于穩(wěn)扎穩(wěn)打下法。25日,柯潔明顯換了一種風(fēng)格,他試圖與AlphaGo激烈對抗,制造更多紛爭。一度,在左下角的一塊棋有劫爭,AlphaGo遲遲不能像慣常做法那樣化繁就簡,“撐在那里”。盤面最復(fù)雜時(shí),有七八條大龍?jiān)谙嗷ソg殺糾纏,盤面充滿不確實(shí)性。

        這是柯潔最興奮的時(shí)刻,后來也被證明是他離勝利最近的時(shí)刻。當(dāng)時(shí),他用手撫了撫心臟。“太緊張的緣故,想讓它跳得慢一點(diǎn)”,柯潔在賽后發(fā)布回顧當(dāng)時(shí)下棋感覺。

        “柯潔在這場比賽中是有很多的機(jī)會。”哈薩比斯說:“前100步是目前為止和AlphaGo下得最勢均力敵的人。”他稱柯潔比賽中一度將AlphaGo逼至了極限。

        遺憾的是,“興奮之后出現(xiàn)了失誤”,柯潔事后坦承未能克服人類的情緒弱點(diǎn)。有情感的人類與只知勝負(fù)概率的AlphaGo之間究竟不是同一物種。

        現(xiàn)在看來,人類或有可能因?yàn)锳lphaGo的棋路和棋譜,挖掘出圍棋更多的、沒有被人類探索和理解的地方,利用得當(dāng),會使目前圍棋整體水平再上一個臺階。重慶人工智能公司云叢科技創(chuàng)始人周曦持此觀點(diǎn)。他對騰訊科技分析說,AlphaGo下了很多人類理解不了的棋,打破了人類圍棋思維定勢,使得人類棋手更多的反思和學(xué)習(xí)。同樣的,人的學(xué)習(xí)抽象理解能力,也不是AlphaGo能掌握的。

        未來是否會開放AlphaGo給所有的圍棋愛好者?戰(zhàn)勝人類棋力最強(qiáng)的柯潔之后,下一次還會舉辦此類圍棋峰會嗎?對于騰訊科技這些問題,AlphaGo方面核心人員之一David Silver避重就輕地給予了回答,“AlphaGo只是作為研究為主,沒有進(jìn)一步計(jì)劃。”

        不過,有一點(diǎn)可以肯定,當(dāng)人工智能的圍棋水平遠(yuǎn)遠(yuǎn)勝過人類之后,人類將放棄繼續(xù)挑戰(zhàn)機(jī)器的狂想,就像今天人們已經(jīng)習(xí)慣普通電子計(jì)算器,誰也不會與它爭一爭計(jì)算加減乘除運(yùn)算速度。也許,到那時(shí)回頭看,本次烏鎮(zhèn)圍棋峰會可能是人機(jī)大戰(zhàn)歷程中最后一個峰會。

      贊(0)
      分享到: 更多 (0)
      網(wǎng)站地圖   滬ICP備18035694號-2    滬公網(wǎng)安備31011702889846號