久久久久久久视色,久久电影免费精品,中文亚洲欧美乱码在线观看,在线免费播放AV片

<center id="vfaef"><input id="vfaef"><table id="vfaef"></table></input></center>

    <p id="vfaef"><kbd id="vfaef"></kbd></p>

    
    
    <pre id="vfaef"><u id="vfaef"></u></pre>

      <thead id="vfaef"><input id="vfaef"></input></thead>

    1. 站長(zhǎng)資訊網(wǎng)
      最全最豐富的資訊網(wǎng)站

      科技巨頭押注智能語(yǔ)音背后的行業(yè)野心

          出品/新摘商業(yè)評(píng)論

      科技巨頭押注智能語(yǔ)音背后的行業(yè)野心
      科技巨頭押注智能語(yǔ)音背后的行業(yè)野心

        近日,一份來(lái)自大西洋彼岸的報(bào)告成為很多人關(guān)注的焦點(diǎn)。

        這份由美國(guó)知名投資機(jī)構(gòu)Mangrove Capital Partners發(fā)布的《2019年語(yǔ)音技術(shù)報(bào)告》(以下簡(jiǎn)稱(chēng)報(bào)告)指出:2025年語(yǔ)音經(jīng)濟(jì)規(guī)?;?qū)⑦_(dá)1萬(wàn)億美元,正式超過(guò)移動(dòng)應(yīng)用經(jīng)濟(jì)。

        人們?cè)缫呀?jīng)捕捉到了某種信號(hào)。

        過(guò)去幾年,谷歌、微軟、亞馬遜、百度等全球科技巨頭紛紛押注語(yǔ)音賽道,投影在人們面前的是接踵而至的明星語(yǔ)音產(chǎn)品——Echo智能音箱、Siri智能語(yǔ)音助手、Google Assistant谷歌語(yǔ)音助手、Cortana(微軟小娜)人工智能助理、Alexa語(yǔ)音識(shí)別引擎、百度小度助手(DuerOS)。

        一個(gè)明顯的感覺(jué)是,語(yǔ)音識(shí)別正在成為人類(lèi)與互聯(lián)網(wǎng)溝通的新主流方式。

        但熱火朝天、寸土必爭(zhēng)的搶跑下注背后,人們不禁會(huì)想到那個(gè)柏拉圖式的問(wèn)題:智能語(yǔ)音到底是什么?它從哪來(lái)?又要到哪去?

        

        科技巨頭搶灘智能語(yǔ)音

        從歷史中不難找到關(guān)于語(yǔ)音技術(shù)的“蛛絲馬跡”。

        早在80年前,首個(gè)能夠合成語(yǔ)音的機(jī)器誕生于美國(guó)新澤西州茉莉山上的貝爾實(shí)驗(yàn)室,如果把語(yǔ)音技術(shù)的發(fā)展看成一條射線,那么這個(gè)被譽(yù)為世界上最偉大的實(shí)驗(yàn)室可以看作是它的起點(diǎn)。

        兩年后的1954年,藍(lán)色“巨人” IBM與喬治城語(yǔ)言學(xué)家合作成功研制出一臺(tái)能夠把60句俄語(yǔ)話(huà)翻譯成英語(yǔ)的機(jī)器。而在不久后,第一個(gè)基于計(jì)算機(jī)的語(yǔ)音合成系統(tǒng)面世,語(yǔ)音技術(shù)就此開(kāi)始被疊加著與日俱增的想象。

        人類(lèi)最不缺乏兩種能力,一種是想象力,另一種是創(chuàng)造力。但即使用幾十年后的今天來(lái)看當(dāng)時(shí),也很難預(yù)測(cè)出語(yǔ)音技術(shù)的發(fā)展軌跡。

        當(dāng)然,更難想到的是,這將成了一個(gè)全球的角斗場(chǎng)。

        對(duì)于智能語(yǔ)音技術(shù),坊間有一個(gè)頗為形象的比喻——遙控中樞。在一切都趨向具像化的如今,語(yǔ)音自然成了下一個(gè)產(chǎn)品形態(tài)的“摩斯密碼”。誰(shuí)能制定密碼規(guī)則,誰(shuí)就能掌控全局。

        這是一場(chǎng)持久戰(zhàn)。

        縱觀當(dāng)下世界智能語(yǔ)音交互市場(chǎng)的幾大主要玩家,百度從2010年開(kāi)始做語(yǔ)音技術(shù),如今已近十年;美國(guó)的亞馬遜Alexa花了二十二年;即便是誕生最晚的谷歌Google Assistant也有著近十余年的數(shù)據(jù)沉淀。

        騏驥千里非一日之功。掩藏在如今頗具智能化的Siri、谷歌助理、微軟小娜以及百度小度背后的是這個(gè)行業(yè)高筑的技術(shù)護(hù)城河。

        今年年初,百度公布了語(yǔ)音領(lǐng)域的四項(xiàng)重大技術(shù)突破,其中,在線語(yǔ)音領(lǐng)域全球首創(chuàng)的流式多級(jí)的截?cái)嘧⒁饬δP?SMLTA,全稱(chēng)為「Streaming trancated multi-layer attention」),被業(yè)界人士將該項(xiàng)技術(shù)突破評(píng)價(jià)為技術(shù)領(lǐng)域的“登月計(jì)劃”。

        在剛過(guò)去不久的AI開(kāi)發(fā)者大會(huì)上,百度展示的一項(xiàng)“全雙工免喚醒”能力,又一次刷新了目前人機(jī)語(yǔ)音交互智能程度的上限。全雙工免喚醒能力是小度助手5.0的重要技術(shù)革新,在全雙工狀態(tài)下的小度,除了能實(shí)現(xiàn)免喚醒詞連續(xù)對(duì)話(huà)之外,還有一個(gè)非常關(guān)鍵的技術(shù)突破,稱(chēng)之為“拒絕反應(yīng)”,即小度知道什么時(shí)候該應(yīng)答和執(zhí)行任務(wù),什么時(shí)候只需要聽(tīng)著,不搭話(huà)、不反應(yīng)——簡(jiǎn)單說(shuō),語(yǔ)音技術(shù)的突破,讓機(jī)器的表現(xiàn)更逼近“真人”了。

        在現(xiàn)場(chǎng),觀眾們感受到的只是更順滑的對(duì)話(huà)、更懂事兒的智能印象,但背后卻是諸多學(xué)術(shù)難題的一一攻克。

        去年公布的第二十屆中國(guó)專(zhuān)利評(píng)審結(jié)果中,百度的語(yǔ)音、機(jī)器翻譯、無(wú)人車(chē)相關(guān)三項(xiàng)專(zhuān)利獲獎(jiǎng),成為人工智能領(lǐng)域至今為止在國(guó)內(nèi)專(zhuān)利界獲得的最高級(jí)別政府獎(jiǎng)項(xiàng)。在此之中,“語(yǔ)音專(zhuān)利”涉及的新語(yǔ)音識(shí)別模型——采用深度學(xué)習(xí)算法在24時(shí)內(nèi)對(duì)數(shù)以百億級(jí)的大規(guī)模數(shù)據(jù)進(jìn)行實(shí)時(shí)分析,高性能計(jì)算,令語(yǔ)音識(shí)別技術(shù)的準(zhǔn)確率達(dá)97%,解決了語(yǔ)音識(shí)別領(lǐng)域關(guān)鍵性、共性的技術(shù)難題,被MIT 評(píng)為“2016年全球十大突破技術(shù)”。

        在AI開(kāi)發(fā)者大會(huì)上,百度還推出了針對(duì)遠(yuǎn)場(chǎng)語(yǔ)音交互的鴻鵠芯片,可以實(shí)現(xiàn)遠(yuǎn)場(chǎng)陣列信號(hào)實(shí)時(shí)處理,高精度超低誤報(bào)語(yǔ)音喚醒以及離線語(yǔ)音識(shí)別。另一邊,百度旗下的明星產(chǎn)品小度智能音箱在今年第一季度更是達(dá)到了330萬(wàn)臺(tái)的超高出貨量,位居中國(guó)市場(chǎng)榜首。顯然,百度正在建立從硬件底層芯片、到上層的智能硬件系統(tǒng),再到系統(tǒng)軟件,語(yǔ)音客戶(hù)端,語(yǔ)音服務(wù)器及后端交互一體化的全鏈路語(yǔ)音交互技術(shù)。

        可以肯定的是,下一個(gè)十年,語(yǔ)音技術(shù)將成為新的決定性主題。

        

        技術(shù)+場(chǎng)景才是王道

        人工智能發(fā)展至今共歷經(jīng)了三次浪潮。

        第一次浪潮使用算法建立了推薦引擎,提供訪問(wèn)互聯(lián)網(wǎng)服務(wù),推動(dòng)了谷歌、亞馬遜和Facebook的崛起。

        第二次浪潮幫助企業(yè)利用結(jié)構(gòu)化數(shù)據(jù)去優(yōu)化決策流程,帶動(dòng)了類(lèi)似Palantir這樣的大數(shù)據(jù)公司的出現(xiàn),它們挖掘大量結(jié)構(gòu)化數(shù)據(jù),找出人眼和人腦難以發(fā)現(xiàn)的信息關(guān)聯(lián)性。

        現(xiàn)在人工智能第三次浪潮襲來(lái),人工智能獲得了眼睛、耳朵和無(wú)數(shù)其他感官,可以收集從來(lái)沒(méi)有過(guò)的新數(shù)據(jù),隨后使用這些數(shù)據(jù)推動(dòng)更復(fù)雜的流程自動(dòng)化。

        這次變革顯然不同以往。恰如最近李彥宏在《人民日?qǐng)?bào)》發(fā)表的文章中所說(shuō),“作為引領(lǐng)此次變革的戰(zhàn)略性技術(shù),人工智能對(duì)世界的影響將遠(yuǎn)超以往歷次工業(yè)革命。”

        事實(shí)確實(shí)如此。在人工智能的大潮下,眾多領(lǐng)域的既有模式被重塑,應(yīng)用場(chǎng)景不斷顛覆,生產(chǎn)關(guān)系開(kāi)始被重新制定。

        而其中,語(yǔ)音則是極其重要的一環(huán)。

        擺脫了文字和屏幕的束縛,語(yǔ)音技術(shù)從根本意義上改變了人們與軟件交互的方式,可以完全替代移動(dòng)應(yīng)用成為未來(lái)通訊的主要方式。

        如果說(shuō)現(xiàn)在人們與移動(dòng)應(yīng)用的互動(dòng)是二維的,那么語(yǔ)音交互就是三維立體的。而這種升維競(jìng)爭(zhēng)同樣也裹挾著互聯(lián)網(wǎng)的商機(jī)。

        語(yǔ)音技術(shù)領(lǐng)域不斷攀升的融資金額是最為明顯的一個(gè)例證。報(bào)告數(shù)據(jù)顯示,今年語(yǔ)音技術(shù)創(chuàng)業(yè)公司融資額高達(dá)7.86億美元,遠(yuǎn)遠(yuǎn)超過(guò)2018年的5.81億美元以及2017年的2.98億美元,同時(shí)每筆融資的規(guī)模也在大幅上升。

        百度是當(dāng)之無(wú)愧的領(lǐng)頭羊。

        作為最早布局人工智能的技術(shù)公司之一,百度擁有建立在超大規(guī)模神經(jīng)網(wǎng)絡(luò)、萬(wàn)億級(jí)參數(shù)、千億級(jí)樣本上的人工智能算法,依托數(shù)十萬(wàn)服務(wù)器和中國(guó)最大的GPU集群的計(jì)算能力;作為中國(guó)最大的搜索引擎公司,百度還收集了大量漢語(yǔ)(尤其是普通話(huà))的音頻數(shù)據(jù),這些都為百度語(yǔ)音識(shí)別系統(tǒng)Deep Speech 2技術(shù)成果提供了基本的數(shù)據(jù)優(yōu)勢(shì)與支持。

        百度美國(guó)的人工智能實(shí)驗(yàn)室負(fù)責(zé)人Adam Coates 曾表示,至2017年2月份,Deep Speech 2的短語(yǔ)識(shí)別詞錯(cuò)率已經(jīng)降到了3.7%,在轉(zhuǎn)錄某些語(yǔ)音的能力也基本上是“超人級(jí)的”,能夠比普通話(huà)母語(yǔ)者更精確地轉(zhuǎn)錄較短的查詢(xún)。

        更引起外界關(guān)注的,是建立在語(yǔ)音識(shí)別、圖像識(shí)別、自然語(yǔ)言處理、用戶(hù)畫(huà)像等技術(shù)能力之上的小度人工智能語(yǔ)音助手(DuerOS對(duì)話(huà)式人工智能系統(tǒng))——百度技術(shù)的集大成者。

        從2015年的“度秘”到2017年發(fā)布的DuerOS,再到2018年發(fā)布的一系列小度智能硬件產(chǎn)品,小度人工智能語(yǔ)音助手保持著穩(wěn)定的迭代速率,不斷融入新能力,以開(kāi)放的姿態(tài)構(gòu)建軟硬結(jié)合的AI生態(tài)系統(tǒng),更好地服務(wù)合作伙伴,成為名副其實(shí)的“智慧中樞”。

        從技術(shù)到產(chǎn)品,從產(chǎn)品到下游合作商,可以看出百度的智能語(yǔ)音系統(tǒng)已然初步成型。技術(shù)與具體場(chǎng)景相結(jié)合,在智能語(yǔ)音交互技術(shù)領(lǐng)域,百度正發(fā)揮著“標(biāo)桿”的作用。

        

        語(yǔ)音,撬動(dòng)未來(lái)商業(yè)的關(guān)鍵

        通用電氣前CEO,被認(rèn)為二十世紀(jì)最杰出CEO的杰克·韋爾奇曾在他的自傳中寫(xiě)道,「如果你想讓車(chē)再快十公里,只需加一加油門(mén),如果讓車(chē)速提高一倍,就要換軌道了。」

        事實(shí)是,商業(yè)的軌道正在發(fā)生偏移。

        《2019語(yǔ)音技術(shù)報(bào)告》中有這樣一種觀點(diǎn):“語(yǔ)音交互扭轉(zhuǎn)了以往人機(jī)交互的存在形態(tài),用戶(hù)與設(shè)備間基于語(yǔ)音交互的全新關(guān)系開(kāi)始搭建,與之前互聯(lián)網(wǎng)向移動(dòng)互聯(lián)網(wǎng)過(guò)渡一樣,其對(duì)底層平臺(tái)的全新需求也在醞釀當(dāng)中。”

        從商業(yè)的發(fā)展模式來(lái)看,變革分兩種,一種是自上而下,另一種是自下而上。前者要求市場(chǎng)迅速調(diào)整身位,迅速利用新的排列組合應(yīng)對(duì)新變化;后者重體驗(yàn),形態(tài)更迭更加悄然無(wú)聲,但更堅(jiān)韌,也更持久。

        語(yǔ)音技術(shù)對(duì)于商業(yè)形態(tài)的影響正如后者。

        不妨對(duì)未來(lái)的商業(yè)雛形做個(gè)預(yù)測(cè):在未來(lái)某個(gè)時(shí)間節(jié)點(diǎn),我們不再需要打字,而是可以使用語(yǔ)音盒手勢(shì),鍵盤(pán)基本消亡,在語(yǔ)音技術(shù)的加持下,產(chǎn)品形態(tài)將會(huì)被徹底改變,無(wú)屏幕的智能手機(jī)、語(yǔ)音電商、語(yǔ)音廣告、個(gè)性化的品牌語(yǔ)音……

        這個(gè)預(yù)測(cè)正在發(fā)展成現(xiàn)實(shí)。

        有數(shù)據(jù)為證,根據(jù)Juniper的數(shù)據(jù)顯示,在美國(guó)和英國(guó),未來(lái)幾年語(yǔ)音電商將迎來(lái)集中爆發(fā),規(guī)模將從2018年的20億美元增長(zhǎng)至2022年的400億美元。

        同步落地的還有亞馬遜的語(yǔ)音廣告業(yè)務(wù)。消息稱(chēng)亞馬遜正計(jì)劃開(kāi)發(fā)Alexa語(yǔ)音助手的商業(yè)價(jià)值,進(jìn)而建立一個(gè)大型的數(shù)字廣告業(yè)務(wù),測(cè)試包括視頻在內(nèi)的多種廣告產(chǎn)品,為2018年廣告營(yíng)收增長(zhǎng)做準(zhǔn)備。

        頻頻布局的背后是各家對(duì)語(yǔ)音技術(shù)商業(yè)價(jià)值的篤定。

        盡管如今留給智能語(yǔ)音技術(shù)的難題還有很多,但在此刻提前布局,構(gòu)筑好技術(shù)底座,待浪潮再次涌來(lái)之時(shí),便能乘勢(shì)而上。

        可以預(yù)見(jiàn),中國(guó)智能語(yǔ)音市場(chǎng)也將成為推動(dòng)這股浪潮不可或缺的力量和重要參與者。正如在中國(guó)徒步旅行三個(gè)月的英國(guó)大臣麥克•貝茨所記錄的那樣:“這片土地從來(lái)不缺乏奇跡。”

      贊(0)
      分享到: 更多 (0)
      網(wǎng)站地圖   滬ICP備18035694號(hào)-2    滬公網(wǎng)安備31011702889846號(hào)