久久久久久久视色,久久电影免费精品,中文亚洲欧美乱码在线观看,在线免费播放AV片

<center id="vfaef"><input id="vfaef"><table id="vfaef"></table></input></center>

    <p id="vfaef"><kbd id="vfaef"></kbd></p>

    
    
    <pre id="vfaef"><u id="vfaef"></u></pre>

      <thead id="vfaef"><input id="vfaef"></input></thead>

    1. 站長資訊網(wǎng)
      最全最豐富的資訊網(wǎng)站

      搜狗推出唇語識(shí)別技術(shù),不過落地還需時(shí)間

      搜狗推出唇語識(shí)別技術(shù),不過落地還需時(shí)間

        從鍵盤打字到觸控屏,再到現(xiàn)在的語音交互和手勢交互,人工智能技術(shù)的發(fā)展,正在促使人機(jī)交互方式向更加多元化方向變革。

        當(dāng)前市場上漸漸出現(xiàn)一種新的人機(jī)交互新技術(shù)——唇語識(shí)別。與語音識(shí)別不同,唇語識(shí)別是基于機(jī)器視覺與自然語言處理于一體的技術(shù),不用聽聲音,僅靠機(jī)器視覺識(shí)別說話人唇部動(dòng)作,就能解讀說話者所說的內(nèi)容,因此在研發(fā)難度上也比語音識(shí)別大得多。

        就在剛剛過去的第四屆烏鎮(zhèn)互聯(lián)網(wǎng)大會(huì)上,一直專注搜索的搜狗竟然也亮相了唇語識(shí)別這一黑科技。12月14日,搜狗在北京舉行了媒體溝通會(huì),公開演示了唇語識(shí)別這項(xiàng)新技術(shù),包括背后的技術(shù)原理、研發(fā)動(dòng)因以及未來的場景應(yīng)用。

        搜狗語音交互中心技術(shù)總監(jiān)陳偉向鈦媒體介紹,得益于搜狗自然語言處理方面的強(qiáng)大優(yōu)勢,搜狗首創(chuàng)了復(fù)雜端到端深度神經(jīng)網(wǎng)絡(luò)技術(shù)進(jìn)行中文唇語序列建模,通過數(shù)千小時(shí)的真實(shí)唇語數(shù)據(jù)訓(xùn)練,建立了10萬詞以上的詞匯表,取得不錯(cuò)的識(shí)別效果。

        具體而言,搜狗通過攝像頭從圖像中連續(xù)識(shí)別出人的唇形,提取說話人連續(xù)的口型變化特征,然后將這些唇語特征放入唇語識(shí)別模型進(jìn)行解碼,從唇語文本數(shù)據(jù)到唇語語言模型進(jìn)一步獲取發(fā)音單元,最終輸出文字。

        目前,搜狗在非特定人開放口語測試集上,即搜狗唇語識(shí)別系統(tǒng)的通用識(shí)別的準(zhǔn)確率在60%以上,超過google發(fā)布的英文唇語系統(tǒng)50%以上的準(zhǔn)確率;而在垂直場景下,如車載、智能家居等場景下已經(jīng)達(dá)到90%的準(zhǔn)確率。

      搜狗推出唇語識(shí)別技術(shù),不過落地還需時(shí)間

        其實(shí)唇語識(shí)別并不神秘。早在2003年,英特爾公司就曾推出一款名叫視聽說識(shí)別系統(tǒng)的軟件,電腦開發(fā)者可以在此基礎(chǔ)上研制讀懂“唇語”的計(jì)算機(jī);而國外技術(shù)最純熟的谷歌,其DeepMind團(tuán)隊(duì)在2016年使用BBC新聞視頻,對AI系統(tǒng)進(jìn)行訓(xùn)練,視頻總長超過5000小時(shí),然后以當(dāng)年3月到9月的視頻節(jié)目進(jìn)行測試,唇語識(shí)別正確率達(dá)到了46.8%。

        這個(gè)正確率雖然不算高,但實(shí)際上正常人的唇語識(shí)別能力也只在10%左右,一些受過訓(xùn)練的唇語專家則可以達(dá)到40%左右。可以想見,唇語識(shí)別技術(shù)的壁壘之高。

        在國內(nèi),BAT這些互聯(lián)網(wǎng)巨頭雖未涉足這一領(lǐng)域,但也有一些創(chuàng)新公司在唇語識(shí)別技術(shù)方面取得了突破。

        今年3月,國內(nèi)專注于大數(shù)據(jù)可視化的海云數(shù)據(jù)也試水唇語識(shí)別,發(fā)布了其與重慶市公安科研所共同研發(fā)的唇語識(shí)別技術(shù)成果。在研發(fā)階段,海云訓(xùn)練了1萬小時(shí)新聞?lì)惞?jié)目,來判斷嘴型的準(zhǔn)確度和語言的準(zhǔn)確性。有報(bào)道稱,海云數(shù)據(jù)的唇語識(shí)別技術(shù)在中文識(shí)別率已高達(dá)71%,英文識(shí)別率達(dá)到80%。

        但陳偉也強(qiáng)調(diào),唇語識(shí)別最大的難點(diǎn)在于泛化性。之所以這一技術(shù)尚未得到普及,很大程度上是識(shí)別率不能做到像語音識(shí)別那樣高,做不到普適性,應(yīng)用的意義也就不大。

        從谷歌唇語識(shí)別系統(tǒng)訓(xùn)練來看,測試集與訓(xùn)練集其實(shí)是同源的,都來自廣播電視新聞,而眾所周知這些播音主持人在發(fā)音、吐字、唇形變化等方面都比普通人要標(biāo)準(zhǔn),如果將測試選擇在普通人時(shí),識(shí)別率應(yīng)該會(huì)更低。

        搜狗為了突破唇語識(shí)別的泛化性,一方面通過各類新聞、電視節(jié)目的數(shù)據(jù)進(jìn)行訓(xùn)練,另一方面通過搜集大量普通人的唇語數(shù)據(jù)進(jìn)行訓(xùn)練,提升了唇語識(shí)別的泛化效果。另外,具體到車載、智能家居場景時(shí),搜狗團(tuán)隊(duì)又通過限定場景、限定語句等形式,對唇語識(shí)別準(zhǔn)確性做了進(jìn)一步優(yōu)化。

        因此,在未來場景落地上,搜狗唇語團(tuán)隊(duì)將關(guān)注兩方面,一方面可以和語音識(shí)別技術(shù)相結(jié)合解決遠(yuǎn)場環(huán)境下的語音問題,另一方面唇語識(shí)別作為人機(jī)交互的形式之一,輔助語音交互及圖像識(shí)別,在日常生活、安防、公益等各個(gè)領(lǐng)域?qū)崿F(xiàn)廣泛應(yīng)用。

        車載場景下,周圍噪音過大時(shí)會(huì)對語音指令產(chǎn)生干擾,通過唇語識(shí)別技術(shù)則可以規(guī)避干擾,保證人車交互的準(zhǔn)確性和穩(wěn)定性,日常不便發(fā)聲的公共場所也可以保證說話內(nèi)容的私密性。

        在安防領(lǐng)域,由于目前多數(shù)監(jiān)控只有攝像頭沒有麥克風(fēng),往往只能看清嘴型卻不知道在說什么,給案情分析帶來很多難題,而唇語識(shí)別技術(shù)可以幫助公安人員獲取重要的講話信息,為公共安全提供有效支持。

        在公益事業(yè)領(lǐng)域,唇語識(shí)別技術(shù)還能發(fā)揮巨大價(jià)值,幫助先天性聽障人群或老年人,讓他們更好地理解和表達(dá)自己。

      搜狗推出唇語識(shí)別技術(shù),不過落地還需時(shí)間

        時(shí)至今日,人工智能的發(fā)展速度已經(jīng)完全超出了我們的想象,那些電影里的炫酷黑科技正在一步步成為現(xiàn)實(shí)出現(xiàn)在我們的生活中。隨著AI技術(shù)的發(fā)展,相信在不遠(yuǎn)的將來,唇語識(shí)別也能像語音識(shí)別、圖像識(shí)別一樣成為我們生活中隨處可見的一部分。

      特別提醒:本網(wǎng)內(nèi)容轉(zhuǎn)載自其他媒體,目的在于傳遞更多信息,并不代表本網(wǎng)贊同其觀點(diǎn)。其原創(chuàng)性以及文中陳述文字和內(nèi)容未經(jīng)本站證實(shí),對本文以及其中全部或者部分內(nèi)容、文字的真實(shí)性、完整性、及時(shí)性本站不作任何保證或承諾,并請自行核實(shí)相關(guān)內(nèi)容。本站不承擔(dān)此類作品侵權(quán)行為的直接責(zé)任及連帶責(zé)任。如若本網(wǎng)有任何內(nèi)容侵犯您的權(quán)益,請及時(shí)聯(lián)系我們,本站將會(huì)在24小時(shí)內(nèi)處理完畢。

      贊(0)
      分享到: 更多 (0)
      網(wǎng)站地圖   滬ICP備18035694號(hào)-2    滬公網(wǎng)安備31011702889846號(hào)