久久久久久久视色,久久电影免费精品,中文亚洲欧美乱码在线观看,在线免费播放AV片

<center id="vfaef"><input id="vfaef"><table id="vfaef"></table></input></center>

<p id="vfaef"><kbd id="vfaef"></kbd></p>

<pre id="vfaef"><u id="vfaef"></u></pre>

<thead id="vfaef"><input id="vfaef"></input></thead>

<s id="n3flj"><abbr id="n3flj"></abbr></s>

<center id="n3flj"><ol id="n3flj"><em id="n3flj"></em></ol></center>

當(dāng)前位置：站長(zhǎng)資訊網(wǎng) > 新聞資訊 > 正文

阿里巴巴達(dá)摩院都干什么了？

2019-07-11 分類：新聞資訊閱讀(768) 評(píng)論(0)

達(dá)摩院成立快兩年之際，機(jī)器智能技術(shù)實(shí)驗(yàn)室搶先展示了一下成績(jī)。

2017 年 10 月，阿里成立了達(dá)摩院，覆蓋 5 個(gè)研究領(lǐng)域，建有 14 個(gè)實(shí)驗(yàn)室。除了上述的“機(jī)器智能”，達(dá)摩院研究大方向還有數(shù)據(jù)計(jì)算、機(jī)器人、金融科技、X 實(shí)驗(yàn)室。

機(jī)器智能技術(shù)實(shí)驗(yàn)室側(cè)重于 AI 相關(guān)技術(shù)的基礎(chǔ)研究，旗下設(shè)有語(yǔ)音實(shí)驗(yàn)室、視覺(jué)實(shí)驗(yàn)室、語(yǔ)言技術(shù)實(shí)驗(yàn)室、決策職能實(shí)驗(yàn)室、以及城市大腦實(shí)驗(yàn)室。

近日，達(dá)摩院機(jī)器智能技術(shù)實(shí)驗(yàn)室舉辦了一場(chǎng)小型媒體溝通會(huì)，幾位技術(shù)專家向外界介紹了最新成果和進(jìn)展。

阿里巴巴達(dá)摩院都干什么了？

兼具表現(xiàn)力和穩(wěn)定性的語(yǔ)音合成技術(shù)

首先，機(jī)器智能技術(shù)實(shí)驗(yàn)室正式發(fā)布了新的語(yǔ)音合成技術(shù) KAN-TTS(KAN 指的是 Knowledge-Aware Neural)。TTS(Text-To-Speech，文本到語(yǔ)音)是一種將文字轉(zhuǎn)化成語(yǔ)音的技術(shù)，智能音箱、個(gè)人虛擬助理都需要這種技術(shù)支持。

達(dá)摩院機(jī)器智能語(yǔ)音實(shí)驗(yàn)室高級(jí)算法專家雷鳴介紹，當(dāng)前業(yè)界商用系統(tǒng)的合成語(yǔ)音與原始音頻錄音的接近程度，通常在85%到90%之間，而基于KAN-TTS技術(shù)的合成語(yǔ)音可將該數(shù)據(jù)提高到97%以上。

簡(jiǎn)單來(lái)說(shuō)，KAN-TTS 合成的語(yǔ)音更加像真人的語(yǔ)音，“接近真人韻律的感覺(jué)”。

阿里巴巴達(dá)摩院都干什么了？

“我們新一代的 TTS 解決方案深度融合了傳統(tǒng) TTS 和端到端 TTS，基于不同領(lǐng)域的深層 Knowledge。”雷鳴介紹道。

所謂端到端 TTS，即不依靠領(lǐng)域知識(shí)，基于強(qiáng)大的深度學(xué)習(xí)模型、海量數(shù)據(jù)來(lái)生成音頻，優(yōu)勢(shì)是大大節(jié)省設(shè)計(jì)的工作，并且得到更加流暢、表現(xiàn)力更好的合成語(yǔ)音，但需要大量計(jì)算力支持，而且會(huì)出現(xiàn)丟字、漏字等不穩(wěn)定的情況。Google 的 Tacotron 和 DeepMind 的 WaveNet 都是典型的端到端 TTS 模型。

而傳統(tǒng) TTS 需要花費(fèi)大量時(shí)間和精力去了解相關(guān)的領(lǐng)域知識(shí)，設(shè)計(jì)難度較高，但勝在合成的語(yǔ)音比較穩(wěn)定。

通過(guò)將傳統(tǒng) TTS 和端到端 TTS 的結(jié)合，KAN-TTS 結(jié)合了兩者的優(yōu)勢(shì)，充分利用不同領(lǐng)域的深層 Knowledge，合成表現(xiàn)力和穩(wěn)定性具佳的語(yǔ)音。

針對(duì)不同的需求，機(jī)器智能技術(shù)實(shí)驗(yàn)室提供了“開(kāi)箱即用”的 TTS 產(chǎn)品，覆蓋 5 大場(chǎng)景(通用場(chǎng)景、客服場(chǎng)景、童聲場(chǎng)景、英文場(chǎng)景和方言場(chǎng)景)，具備 34 個(gè)高品質(zhì)的聲音。

阿里巴巴達(dá)摩院都干什么了？

除了“開(kāi)箱即用”的聲音，達(dá)摩院這個(gè)語(yǔ)音合成方案還能讓專業(yè)用戶定制聲音。

傳統(tǒng)語(yǔ)音合成定制需要10小時(shí)以上的數(shù)據(jù)錄制和標(biāo)注，對(duì)錄音人和錄音環(huán)境要求很高。“從啟動(dòng)定制到最終交付，需要半年時(shí)間”。而達(dá)摩院利用Multi-Speaker Model與Speaker-aware Advanced Transfer Learning相結(jié)合的方法，將語(yǔ)音合成定制成本降低10倍以上，周期壓縮3倍以上。

也就是說(shuō)，用1小時(shí)有效錄音數(shù)據(jù)和不到兩個(gè)月制作周期，就能完成一次標(biāo)準(zhǔn) TTS 定制。

此外，普通用戶也可以自己定制“AI聲音”，只需手機(jī)錄音十分鐘，就能獲得與錄制聲音高度相似的合成語(yǔ)音。

阿里巴巴達(dá)摩院都干什么了？

語(yǔ)音、自然語(yǔ)言、視覺(jué)各領(lǐng)域都有新成績(jī)

除了公布新語(yǔ)言合成方案，機(jī)器智能技術(shù)實(shí)驗(yàn)室還亮出了新成績(jī)。

機(jī)器智能技術(shù)實(shí)驗(yàn)室透露，阿里AI在國(guó)際頂級(jí)技術(shù)賽事上獲得了40多項(xiàng)世界第一，入選了近400篇國(guó)際頂會(huì)論文。具體到細(xì)分領(lǐng)域，機(jī)器智能技術(shù)實(shí)驗(yàn)室最近都有不同建樹(shù)。

語(yǔ)音領(lǐng)域，2019年1月機(jī)器智能技術(shù)實(shí)驗(yàn)室在國(guó)際頂級(jí)對(duì)話系統(tǒng)評(píng)測(cè)大賽(DSTC-7)上獲得雙料冠軍，將人機(jī)對(duì)話準(zhǔn)確率的世界紀(jì)錄提升至94.1%，并于2019年7月開(kāi)源了創(chuàng)造這一記錄背后的人機(jī)對(duì)話模型 ESIM。

事實(shí)，該算法模型提出了兩年多，已被包括谷歌、facebook在內(nèi)的國(guó)際學(xué)術(shù)界在200多篇論文中引用。

阿里巴巴達(dá)摩院都干什么了？

自然語(yǔ)言理解方面，機(jī)器智能技術(shù)實(shí)驗(yàn)室在 6 月的 MS MARCO 文本閱讀理解挑戰(zhàn)賽中，擊敗了 Facebook和微軟，創(chuàng)造了閱讀理解能力測(cè)試的新紀(jì)錄，并在開(kāi)放域問(wèn)答任務(wù)上超越人類閱讀水平。

MS MARCO 挑戰(zhàn)賽是 AI 閱讀理解領(lǐng)域的權(quán)威比賽，參賽機(jī)構(gòu)提供的 AI 模型需要在搜索引擎返回的網(wǎng)頁(yè)文檔中，找出 100 萬(wàn)個(gè)問(wèn)題的正確答案。

阿里方面介紹，阿里 AI 模型的突破在于提出了基于 “融合結(jié)構(gòu)化信息 BERT 模型” 的 “深度級(jí)聯(lián)機(jī)器閱讀模型”，可以模仿人類閱讀理解的過(guò)程，先對(duì)文檔進(jìn)行快速瀏覽，判斷，然后針對(duì)相應(yīng)段落進(jìn)行精讀，并根據(jù) “自己的理解” 回答問(wèn)題。

達(dá)摩院機(jī)器翻譯技術(shù)團(tuán)隊(duì)已實(shí)現(xiàn)了48個(gè)語(yǔ)言翻譯方向，支持俄、西、法、阿、土，泰、印尼、越南等多種語(yǔ)言翻譯，其中電商覆蓋了大部分語(yǔ)向和場(chǎng)景，超越了谷歌和亞馬遜，日調(diào)用量達(dá)到17.9億次。

阿里巴巴達(dá)摩院都干什么了？

在機(jī)器視覺(jué)領(lǐng)域，機(jī)器智能技術(shù)實(shí)驗(yàn)室在圖像搜索、大規(guī)模圖像識(shí)別、視頻分析、線下視覺(jué)智能等領(lǐng)域都有所建樹(shù)。其中，圖像搜索領(lǐng)域，阿里 AI 的向量引擎比Facebook快6倍。

機(jī)器智能技術(shù)實(shí)驗(yàn)室在 6 月份剛剛結(jié)束的 WebVision 競(jìng)賽中，阿里 AI 以 82.54% 的識(shí)別準(zhǔn)確率，擊敗了全世界150多支參賽隊(duì)伍，獲得冠軍。機(jī)器智能技術(shù)實(shí)驗(yàn)室稱，阿里 AI 目前可以識(shí)別超過(guò) 100 萬(wàn)種物理實(shí)體。

WebVison 是目前圖像識(shí)別領(lǐng)域最權(quán)威的競(jìng)賽之一，專注于物體識(shí)別，被譽(yù)為接棒 ImageNet 的大規(guī)模圖像識(shí)別競(jìng)賽。

7 月，在CVPR2019舉辦的LPIRC(低功耗圖像識(shí)別挑戰(zhàn)賽)中，阿里AI獲得在線圖像分類任務(wù)第一名。在挑戰(zhàn)賽使用的訓(xùn)練數(shù)據(jù)集上，阿里AI實(shí)現(xiàn)了67.4%的分類精度，比官方提供的基準(zhǔn)線高3.5%。

值得注意的是，上述只是達(dá)摩院旗下機(jī)器智能技術(shù)實(shí)驗(yàn)室的進(jìn)展和成績(jī)。到 2019 年 10 月達(dá)摩院兩周年之際，會(huì)有更加全面的消息公布。

贊(0)

標(biāo)簽：AI Facebook 亞馬遜微軟搜索引擎機(jī)器人電商谷歌阿里阿里巴巴

相關(guān)推薦

網(wǎng)站地圖滬ICP備18035694號(hào)-2

滬公網(wǎng)安備31011702889846號(hào)