久久久久久久视色,久久电影免费精品,中文亚洲欧美乱码在线观看,在线免费播放AV片

<center id="vfaef"><input id="vfaef"><table id="vfaef"></table></input></center>

    <p id="vfaef"><kbd id="vfaef"></kbd></p>

    
    
    <pre id="vfaef"><u id="vfaef"></u></pre>

      <thead id="vfaef"><input id="vfaef"></input></thead>

    1. 站長(zhǎng)資訊網(wǎng)
      最全最豐富的資訊網(wǎng)站

      超越Siri、Google Now?百度語音合成大咖要教機(jī)器真正“說人話”

        “我們?yōu)槭裁匆稣Z音合成?剛才也提到了,讓機(jī)器說話是人類千百年來的夢(mèng)想;而對(duì)于一些特殊群體,他們的受教育程度等問題造成了他們獲取現(xiàn)代信息的障礙。如果我們給他們直接提供更自然的語音內(nèi)容,可以改善他們不能平等享受信息的現(xiàn)狀。”7月26日,負(fù)責(zé)百度語音合成系統(tǒng)開發(fā)工作的李秀林在第52期百度技術(shù)沙龍上說。

        語音合成也被稱為文語轉(zhuǎn)換,是將文本轉(zhuǎn)換成語音的一種技術(shù)。在日常生活中,我們已經(jīng)用到很多使用語音合成技術(shù)的產(chǎn)品,例如汽車導(dǎo)航內(nèi)嵌了語音系統(tǒng)、智能手機(jī)的語音助手、讀書軟件等等,這些應(yīng)用的實(shí)現(xiàn)都離不開語音合成。而如今非?;鸨目纱┐髦悄茉O(shè)備,也為語音技術(shù)提供了嶄新的實(shí)用空間。本期的百度技術(shù)沙龍,李秀林與大家分享了百度在語音合成技術(shù)方面的話題和研發(fā)成果。

        在充滿創(chuàng)新能量的中關(guān)村創(chuàng)業(yè)大街,每月舉辦的百度技術(shù)沙龍成為眾多開發(fā)者和技術(shù)愛好者們學(xué)習(xí)、交流、碰撞思維、開拓眼界的最佳平臺(tái),而來自百度的嘉賓講師所帶來的最前沿技術(shù)分享往往成為活動(dòng)的亮點(diǎn)。

      超越Siri、Google Now?百度語音合成大咖要教機(jī)器真正“說人話”

        負(fù)責(zé)百度語音合成系統(tǒng)開發(fā)工作的李秀林說:“千百年來人們一直在期待著機(jī)器能夠開口說話,這就是語音合成。”

        百度語音合成:“折衷”的藝術(shù)

        2013年初,百度就開始進(jìn)行語音合成技術(shù)的研究,歷經(jīng)一年左右的時(shí)間,2014年4月份,百度語音合成正式通過開放平臺(tái)對(duì)外開放;2014年7月,語音合成技術(shù)也成功地應(yīng)用于百度搜索框這個(gè)重量級(jí)的應(yīng)用。

        “作為國(guó)內(nèi)搜索行業(yè)的領(lǐng)導(dǎo)者,百度在大數(shù)據(jù)積累、自然語言處理方面有著深厚的底蘊(yùn),但在語音合成技術(shù)的研發(fā)過程中,挑戰(zhàn)仍層出不窮,而不同層面的折衷處理也是技術(shù)攻關(guān)的難點(diǎn)所在。”李秀林表示。

        基于中文發(fā)音的語音合成一直是業(yè)內(nèi)技術(shù)難點(diǎn),而針對(duì)觀眾所提出的使用HMM框架是否會(huì)導(dǎo)致語音合成質(zhì)量下降的問題,李秀林老師也給出了答案。

        據(jù)他介紹,中文語音合成需處理多達(dá)1400多個(gè)帶調(diào)的音節(jié),每個(gè)音節(jié)的前后音連、調(diào)連等不同語境又衍生出數(shù)百萬的上下文情況。對(duì)此,百度靈活應(yīng)用了語音學(xué)和語言學(xué)的知識(shí),對(duì)上下文情境進(jìn)行適當(dāng)分類,縮小特征空間。以聲母的分類為例,根據(jù)發(fā)音方法和發(fā)音位置的不同,聲母的類型可以被從二十幾個(gè)壓縮到十幾個(gè)甚至幾個(gè)的規(guī)模。

        在開發(fā)過程中,百度語音合成系統(tǒng)采用了聲母和韻母作為基本的單元,有效減小了單元量,并借此進(jìn)一步壓縮特征空間的大小。在此基礎(chǔ)上,錄音語料、錄音規(guī)模跟發(fā)音者之間、模型訓(xùn)練的充分性與可拓展性之間、主觀感知與聲學(xué)參數(shù)之間的折衷處理也獲得了更大的操作空間。

        “折衷,其實(shí)不是對(duì)付做一個(gè)(語音合成系統(tǒng))就可以了;折衷的目標(biāo)是為了讓語音合成的表現(xiàn)更加卓越。”李秀林說。

        擁抱開發(fā)者,百度語音全面開放

        2014年4月份,百度語音合成正式通過語音開放平臺(tái),向開發(fā)者免費(fèi)開放,開發(fā)者可以通過網(wǎng)站獲得相關(guān)的技術(shù)文檔和開發(fā)資料,并以此為基礎(chǔ)更加輕松地開發(fā)含有對(duì)話系統(tǒng)或者是閱讀信息系統(tǒng)的應(yīng)用。

        “開發(fā)者只需要下載SDK,在自己的APP里面用相關(guān)的接口,百度的在線系統(tǒng)即可幫助開發(fā)者管理數(shù)據(jù)、機(jī)器、網(wǎng)絡(luò)等等一系列的問題,開發(fā)者可以把精力集中在自己想要展現(xiàn)的功能上。”李秀林說。

        在2013年10月月正式向開發(fā)者開放后,百度語音平臺(tái)已經(jīng)吸引了包括陌陌、去哪兒、國(guó)航等大批移動(dòng)應(yīng)用使用。百度語音開放平臺(tái)提供的一整套完備的解決方案,讓每一位開發(fā)者都能以最低的成本將最先進(jìn)的語音合成與識(shí)別技術(shù)整合進(jìn)自己的產(chǎn)品中。

        百度語音合成系統(tǒng)的前端是基于海量語料的自然語言理解技術(shù),實(shí)現(xiàn)智能分詞、高精度的多音字處理、準(zhǔn)確的韻律層級(jí)預(yù)測(cè)。利用數(shù)萬句話的精加工語音庫,通過采用HMM框架和問題集優(yōu)化,得到了既穩(wěn)健、又有一定表現(xiàn)力的聲學(xué)模型。最后,經(jīng)過快速單元預(yù)選,多層次的代價(jià)優(yōu)化,選出最合適的單元進(jìn)行拼接。對(duì)于開發(fā)者來說,百度語音開放平臺(tái)為他們的應(yīng)用帶來了更豐富的應(yīng)用場(chǎng)景和更開闊的想象空間。

        “百度的使命就是讓人們更平等便捷地獲取信息找到所求;通過語音合成技術(shù),我們可以讓信息更符合用戶所求。”李秀林說。

        據(jù)了解,百度技術(shù)沙龍是國(guó)內(nèi)互聯(lián)網(wǎng)界最早的技術(shù)開放交流活動(dòng),由百度組織策劃,至今已經(jīng)持續(xù)舉辦4年。百度技術(shù)沙龍致力于以“技術(shù)開放”的心態(tài),分享行業(yè)領(lǐng)先的技術(shù)理念和技術(shù)實(shí)踐。目前,百度技術(shù)沙龍已經(jīng)成為互聯(lián)網(wǎng)行業(yè)中高端技術(shù)人員的精神家園,有效推動(dòng)國(guó)內(nèi)互聯(lián)網(wǎng)的技術(shù)發(fā)展與行業(yè)創(chuàng)新。?

      特別提醒:本網(wǎng)內(nèi)容轉(zhuǎn)載自其他媒體,目的在于傳遞更多信息,并不代表本網(wǎng)贊同其觀點(diǎn)。其原創(chuàng)性以及文中陳述文字和內(nèi)容未經(jīng)本站證實(shí),對(duì)本文以及其中全部或者部分內(nèi)容、文字的真實(shí)性、完整性、及時(shí)性本站不作任何保證或承諾,并請(qǐng)自行核實(shí)相關(guān)內(nèi)容。本站不承擔(dān)此類作品侵權(quán)行為的直接責(zé)任及連帶責(zé)任。如若本網(wǎng)有任何內(nèi)容侵犯您的權(quán)益,請(qǐng)及時(shí)聯(lián)系我們,本站將會(huì)在24小時(shí)內(nèi)處理完畢。

      贊(0)
      分享到: 更多 (0)
      網(wǎng)站地圖   滬ICP備18035694號(hào)-2    滬公網(wǎng)安備31011702889846號(hào)