久久久久久久视色,久久电影免费精品,中文亚洲欧美乱码在线观看,在线免费播放AV片

<center id="vfaef"><input id="vfaef"><table id="vfaef"></table></input></center>

    <p id="vfaef"><kbd id="vfaef"></kbd></p>

    
    
    <pre id="vfaef"><u id="vfaef"></u></pre>

      <thead id="vfaef"><input id="vfaef"></input></thead>

    1. 站長資訊網(wǎng)
      最全最豐富的資訊網(wǎng)站

      搜狗推出唇語識別技術(shù),不過落地還需時間

      搜狗推出唇語識別技術(shù),不過落地還需時間

        從鍵盤打字到觸控屏,再到現(xiàn)在的語音交互和手勢交互,人工智能技術(shù)的發(fā)展,正在促使人機交互方式向更加多元化方向變革。

        當(dāng)前市場上漸漸出現(xiàn)一種新的人機交互新技術(shù)——唇語識別。與語音識別不同,唇語識別是基于機器視覺與自然語言處理于一體的技術(shù),不用聽聲音,僅靠機器視覺識別說話人唇部動作,就能解讀說話者所說的內(nèi)容,因此在研發(fā)難度上也比語音識別大得多。

        就在剛剛過去的第四屆烏鎮(zhèn)互聯(lián)網(wǎng)大會上,一直專注搜索的搜狗竟然也亮相了唇語識別這一黑科技。12月14日,搜狗在北京舉行了媒體溝通會,公開演示了唇語識別這項新技術(shù),包括背后的技術(shù)原理、研發(fā)動因以及未來的場景應(yīng)用。

        搜狗語音交互中心技術(shù)總監(jiān)陳偉向鈦媒體介紹,得益于搜狗自然語言處理方面的強大優(yōu)勢,搜狗首創(chuàng)了復(fù)雜端到端深度神經(jīng)網(wǎng)絡(luò)技術(shù)進行中文唇語序列建模,通過數(shù)千小時的真實唇語數(shù)據(jù)訓(xùn)練,建立了10萬詞以上的詞匯表,取得不錯的識別效果。

        具體而言,搜狗通過攝像頭從圖像中連續(xù)識別出人的唇形,提取說話人連續(xù)的口型變化特征,然后將這些唇語特征放入唇語識別模型進行解碼,從唇語文本數(shù)據(jù)到唇語語言模型進一步獲取發(fā)音單元,最終輸出文字。

        目前,搜狗在非特定人開放口語測試集上,即搜狗唇語識別系統(tǒng)的通用識別的準確率在60%以上,超過google發(fā)布的英文唇語系統(tǒng)50%以上的準確率;而在垂直場景下,如車載、智能家居等場景下已經(jīng)達到90%的準確率。

      搜狗推出唇語識別技術(shù),不過落地還需時間

        其實唇語識別并不神秘。早在2003年,英特爾公司就曾推出一款名叫視聽說識別系統(tǒng)的軟件,電腦開發(fā)者可以在此基礎(chǔ)上研制讀懂“唇語”的計算機;而國外技術(shù)最純熟的谷歌,其DeepMind團隊在2016年使用BBC新聞視頻,對AI系統(tǒng)進行訓(xùn)練,視頻總長超過5000小時,然后以當(dāng)年3月到9月的視頻節(jié)目進行測試,唇語識別正確率達到了46.8%。

        這個正確率雖然不算高,但實際上正常人的唇語識別能力也只在10%左右,一些受過訓(xùn)練的唇語專家則可以達到40%左右。可以想見,唇語識別技術(shù)的壁壘之高。

        在國內(nèi),BAT這些互聯(lián)網(wǎng)巨頭雖未涉足這一領(lǐng)域,但也有一些創(chuàng)新公司在唇語識別技術(shù)方面取得了突破。

        今年3月,國內(nèi)專注于大數(shù)據(jù)可視化的海云數(shù)據(jù)也試水唇語識別,發(fā)布了其與重慶市公安科研所共同研發(fā)的唇語識別技術(shù)成果。在研發(fā)階段,海云訓(xùn)練了1萬小時新聞類節(jié)目,來判斷嘴型的準確度和語言的準確性。有報道稱,海云數(shù)據(jù)的唇語識別技術(shù)在中文識別率已高達71%,英文識別率達到80%。

        但陳偉也強調(diào),唇語識別最大的難點在于泛化性。之所以這一技術(shù)尚未得到普及,很大程度上是識別率不能做到像語音識別那樣高,做不到普適性,應(yīng)用的意義也就不大。

        從谷歌唇語識別系統(tǒng)訓(xùn)練來看,測試集與訓(xùn)練集其實是同源的,都來自廣播電視新聞,而眾所周知這些播音主持人在發(fā)音、吐字、唇形變化等方面都比普通人要標準,如果將測試選擇在普通人時,識別率應(yīng)該會更低。

        搜狗為了突破唇語識別的泛化性,一方面通過各類新聞、電視節(jié)目的數(shù)據(jù)進行訓(xùn)練,另一方面通過搜集大量普通人的唇語數(shù)據(jù)進行訓(xùn)練,提升了唇語識別的泛化效果。另外,具體到車載、智能家居場景時,搜狗團隊又通過限定場景、限定語句等形式,對唇語識別準確性做了進一步優(yōu)化。

        因此,在未來場景落地上,搜狗唇語團隊將關(guān)注兩方面,一方面可以和語音識別技術(shù)相結(jié)合解決遠場環(huán)境下的語音問題,另一方面唇語識別作為人機交互的形式之一,輔助語音交互及圖像識別,在日常生活、安防、公益等各個領(lǐng)域?qū)崿F(xiàn)廣泛應(yīng)用。

        車載場景下,周圍噪音過大時會對語音指令產(chǎn)生干擾,通過唇語識別技術(shù)則可以規(guī)避干擾,保證人車交互的準確性和穩(wěn)定性,日常不便發(fā)聲的公共場所也可以保證說話內(nèi)容的私密性。

        在安防領(lǐng)域,由于目前多數(shù)監(jiān)控只有攝像頭沒有麥克風(fēng),往往只能看清嘴型卻不知道在說什么,給案情分析帶來很多難題,而唇語識別技術(shù)可以幫助公安人員獲取重要的講話信息,為公共安全提供有效支持。

        在公益事業(yè)領(lǐng)域,唇語識別技術(shù)還能發(fā)揮巨大價值,幫助先天性聽障人群或老年人,讓他們更好地理解和表達自己。

      搜狗推出唇語識別技術(shù),不過落地還需時間

        時至今日,人工智能的發(fā)展速度已經(jīng)完全超出了我們的想象,那些電影里的炫酷黑科技正在一步步成為現(xiàn)實出現(xiàn)在我們的生活中。隨著AI技術(shù)的發(fā)展,相信在不遠的將來,唇語識別也能像語音識別、圖像識別一樣成為我們生活中隨處可見的一部分。

      特別提醒:本網(wǎng)內(nèi)容轉(zhuǎn)載自其他媒體,目的在于傳遞更多信息,并不代表本網(wǎng)贊同其觀點。其原創(chuàng)性以及文中陳述文字和內(nèi)容未經(jīng)本站證實,對本文以及其中全部或者部分內(nèi)容、文字的真實性、完整性、及時性本站不作任何保證或承諾,并請自行核實相關(guān)內(nèi)容。本站不承擔(dān)此類作品侵權(quán)行為的直接責(zé)任及連帶責(zé)任。如若本網(wǎng)有任何內(nèi)容侵犯您的權(quán)益,請及時聯(lián)系我們,本站將會在24小時內(nèi)處理完畢。

      贊(0)
      分享到: 更多 (0)
      網(wǎng)站地圖   滬ICP備18035694號-2    滬公網(wǎng)安備31011702889846號