在7月3日的“Baidu Create 2019”百度 AI開(kāi)發(fā)者大會(huì)上,百度首席技術(shù)官王海峰博士正式發(fā)布了百度大腦5.0。這可以說(shuō)是百度大腦史上最具跨越性的一次重磅升級(jí),在算法創(chuàng)新、AI計(jì)算架構(gòu)層面均實(shí)現(xiàn)重大突破。當(dāng)天下午,百度大腦分論壇如期舉行。眾多百度技術(shù)大佬們?cè)趦蓚€(gè)半小時(shí)內(nèi)悉數(shù)登場(chǎng),解密十余項(xiàng)AI前沿技術(shù)的最新進(jìn)展。
其中,百度AI技術(shù)平臺(tái)體系執(zhí)行總監(jiān)吳甜圍繞百度語(yǔ)言與知識(shí)技術(shù)的整體布局,做了詳細(xì)介紹。語(yǔ)言方面,百度大腦推出知識(shí)增強(qiáng)語(yǔ)義理解框架ERNIE,以及兼具高準(zhǔn)確、低時(shí)延的機(jī)器同傳技術(shù);知識(shí)方面,全面解析基于百度知識(shí)圖譜技術(shù)的視頻語(yǔ)義理解能力。同時(shí),重磅推出行業(yè)知識(shí)圖譜平臺(tái)和智能創(chuàng)作平臺(tái)2.0兩大應(yīng)用級(jí)平臺(tái)。
核心算法全面升級(jí) 保持業(yè)界領(lǐng)先水平
在語(yǔ)言與知識(shí)技術(shù)中,語(yǔ)義理解是重要的基礎(chǔ)之一。吳甜介紹了近期百度大腦在語(yǔ)義理解上的重要突破,推出基于知識(shí)增強(qiáng)的語(yǔ)義理解框架ERNIE。“不僅在學(xué)術(shù)界的公開(kāi)數(shù)據(jù)集上,ERNIE也一直在百度實(shí)際的應(yīng)用中展現(xiàn)實(shí)力,比如智能問(wèn)答、CPR預(yù)估、文本潤(rùn)色、對(duì)話理解等等,”吳甜說(shuō)到。截至目前,ERNIE已經(jīng)學(xué)習(xí)了超10億知識(shí)。由此,ERNIE全面刷新中文NLP任務(wù)的效果,成為業(yè)界效果最好的語(yǔ)義理解框架,幫助AI更深度地理解真實(shí)世界。

機(jī)器同傳方面也有最新進(jìn)展,在翻譯過(guò)程中對(duì)語(yǔ)音識(shí)別結(jié)果進(jìn)行糾錯(cuò)的聯(lián)合詞向量編碼技術(shù),可解決翻譯一致性和連貫性問(wèn)題的語(yǔ)篇翻譯模型等,結(jié)合先進(jìn)的語(yǔ)音技術(shù),百度大腦實(shí)現(xiàn)了高準(zhǔn)確、低時(shí)延的端到端機(jī)器同傳技術(shù)。在本次大會(huì)上,現(xiàn)場(chǎng)聽(tīng)眾掃描二維碼,即可通過(guò)手機(jī)同步收聽(tīng)機(jī)器同傳流暢、自然播報(bào)的聲音,獲得沉浸式體驗(yàn)。
知識(shí),能幫助AI更深度地理解真實(shí)世界。在主論壇中,王海峰用近期熱映的音樂(lè)紀(jì)錄片《大河唱》,形象展示了融合百度知識(shí)圖譜技術(shù)的視頻語(yǔ)義理解能力。該技術(shù)通過(guò)對(duì)視頻的多模態(tài)知識(shí)解析,在多元異構(gòu)知識(shí)圖譜上建立關(guān)聯(lián),并通過(guò)計(jì)算推理,建立對(duì)視頻的深度語(yǔ)義理解。
解密百度語(yǔ)言與知識(shí)技術(shù)平臺(tái)全貌
百度在語(yǔ)言與知識(shí)技術(shù)方面的重大更新,依靠的是在該領(lǐng)域的長(zhǎng)期積累?,F(xiàn)場(chǎng),吳甜展示了百度語(yǔ)言與知識(shí)技術(shù)開(kāi)放平臺(tái)的全景圖,其中不僅有豐富的基礎(chǔ)技術(shù),還有包括翻譯開(kāi)放平臺(tái)、UNIT平臺(tái)、行業(yè)知識(shí)圖譜平臺(tái)和智能創(chuàng)作平臺(tái)在內(nèi)的4個(gè)應(yīng)用級(jí)平臺(tái)。
“從使用規(guī)模、便捷性和價(jià)值來(lái)看,這是NLP和知識(shí)技術(shù)大生產(chǎn)平臺(tái)。”吳甜這樣介紹百度語(yǔ)言與知識(shí)技術(shù)開(kāi)放平臺(tái)。30多項(xiàng)技術(shù)供給,多樣、靈活、可定制的服務(wù)方式,多套場(chǎng)景技術(shù)方案以及全面領(lǐng)先的多語(yǔ)言與知識(shí)技術(shù),包括最好的中文語(yǔ)義理解框架ERNIE以及最大的多元語(yǔ)義知識(shí)圖譜等,使得平臺(tái)具有很好的便捷性價(jià)值。目前,平臺(tái)日均調(diào)用量達(dá)千億級(jí),吸引了20萬(wàn)開(kāi)發(fā)者,綜合規(guī)模巨大。今年,百度基于飛槳(PaddlePaddle)平臺(tái)正式開(kāi)源了百度多年積累的中文NLP工具和數(shù)據(jù)集Paddle NLP,吳甜表示,Paddle NLP的發(fā)布是開(kāi)源、開(kāi)放、大生產(chǎn)平臺(tái)階段一個(gè)重要的里程碑。
應(yīng)用級(jí)平臺(tái)再升級(jí):行業(yè)知識(shí)圖譜、智能創(chuàng)作2.0
在吳甜的發(fā)言中,兩大應(yīng)用級(jí)平臺(tái)的重磅新發(fā)布作為壓軸戲登場(chǎng),一是行業(yè)知識(shí)圖譜平臺(tái),二是智能創(chuàng)作平臺(tái)2.0。
行業(yè)知識(shí)圖譜平臺(tái)基于領(lǐng)先的知識(shí)圖譜核心技術(shù),提供智能高效的知識(shí)生產(chǎn)流程、低成本啟動(dòng)和跨行業(yè)遷移的能力,幫助產(chǎn)業(yè)開(kāi)發(fā)者定制行業(yè)知識(shí)圖譜并應(yīng)用。
行業(yè)智能化的大量需求,對(duì)行業(yè)知識(shí)的積累和應(yīng)用帶來(lái)了巨大的挑戰(zhàn)。后者的知識(shí)構(gòu)建通常需要領(lǐng)域?qū)<覅⑴c,而傳統(tǒng)知識(shí)圖譜耗時(shí)、耗力、成本高。吳甜進(jìn)一步解釋道,百度打造了行業(yè)知識(shí)圖譜平臺(tái),旨在能通過(guò)百度自身積累的知識(shí)圖譜技術(shù),實(shí)現(xiàn)行業(yè)知識(shí)自動(dòng)獲取和應(yīng)用,助力企業(yè)實(shí)現(xiàn)智能化升級(jí)。百度行業(yè)知識(shí)圖譜具有深入復(fù)雜和專(zhuān)業(yè)兩大特點(diǎn),且具備遷移學(xué)習(xí)能力,低成本啟動(dòng),能幫助產(chǎn)業(yè)開(kāi)發(fā)者定制行業(yè)知識(shí)圖譜并應(yīng)用。
同時(shí),吳甜還向現(xiàn)場(chǎng)觀眾介紹了升級(jí)后的百度大腦智能創(chuàng)作平臺(tái)2.0。如果說(shuō)去年百度世界大會(huì)上發(fā)布且在今年4月完成能力全面開(kāi)放的智能創(chuàng)作平臺(tái)1.0,是讓創(chuàng)作者從枯燥和繁忙的“趕稿”日常中解放出來(lái),那么2.0版本塑造的是更智能、更貼心的自動(dòng)創(chuàng)作服務(wù)。據(jù)吳甜所說(shuō),智能創(chuàng)作平臺(tái)2.0具有三大特點(diǎn)。
一是實(shí)時(shí)熱點(diǎn)關(guān)聯(lián)豐富素材,以知識(shí)圖譜為基礎(chǔ),提供熱點(diǎn)事件、熱詞關(guān)聯(lián)和事件脈絡(luò)等不同角度的素材,包含文本、圖片、視頻等多種模態(tài),為創(chuàng)作者提供新鮮、實(shí)用的創(chuàng)作靈感和素材支持,讓撰稿者不再談“熱點(diǎn)”色變。二是全面的創(chuàng)作輔助能力,該平臺(tái)提供了全面的創(chuàng)作輔助能力,例如快速創(chuàng)作時(shí)效性內(nèi)容的自動(dòng)創(chuàng)作功能、幫助創(chuàng)作者優(yōu)化文字細(xì)節(jié)的糾錯(cuò)和潤(rùn)色功能、在發(fā)布內(nèi)容前補(bǔ)充信息的自動(dòng)標(biāo)簽和摘要功能等。三是領(lǐng)先的多模生成技術(shù),以短視頻為例,多模態(tài)是內(nèi)容創(chuàng)作的重要趨勢(shì)。綜合利用百度視覺(jué)、語(yǔ)音、文本的多模態(tài)理解能力,百度研發(fā)了自動(dòng)根據(jù)圖文創(chuàng)作視頻,以及根據(jù)視頻創(chuàng)作圖文的先進(jìn)技術(shù)。這些技術(shù)可以幫助創(chuàng)作者高效完成多種模態(tài)的內(nèi)容生產(chǎn)。
語(yǔ)言與知識(shí)技術(shù)是機(jī)器與人交流、理解真實(shí)世界的重要基礎(chǔ),百度大腦在此方面的系列創(chuàng)新,拉近了人與機(jī)器的距離。在最后,吳甜在大屏幕上用了“突破創(chuàng)新、開(kāi)源開(kāi)放、智見(jiàn)未來(lái)”十二個(gè)大字,結(jié)束了她的演講。這也是百度在語(yǔ)言與知識(shí)技術(shù)領(lǐng)域的長(zhǎng)期發(fā)展目標(biāo),將持續(xù)為開(kāi)發(fā)者和相關(guān)領(lǐng)域提供更好的技術(shù)支持。
從該場(chǎng)論壇來(lái)看,百度大腦5.0已經(jīng)打通了從基礎(chǔ)層的深度學(xué)習(xí)技術(shù)到通用AI能力、應(yīng)用技術(shù)方案,再到定制化模型,以及最終的部署和集成,整個(gè)人工智能產(chǎn)業(yè)化應(yīng)用落地的全部流程,實(shí)現(xiàn)了AI技術(shù)的標(biāo)準(zhǔn)化、自動(dòng)化和模塊化。而這股打通“任督二脈”的“神功”,百度正在開(kāi)放給更多開(kāi)發(fā)者,希望大家都能平等便捷地獲取AI能力,加速產(chǎn)業(yè)智能化進(jìn)程。