在7月3日的“Baidu Create 2019”百度 AI開發(fā)者大會上,百度首席技術(shù)官王海峰博士正式發(fā)布了百度大腦5.0。這可以說是百度大腦史上最具跨越性的一次重磅升級,在算法創(chuàng)新、AI計(jì)算架構(gòu)層面均實(shí)現(xiàn)重大突破。當(dāng)天下午,百度大腦分論壇如期舉行。眾多百度技術(shù)大佬們在兩個(gè)半小時(shí)內(nèi)悉數(shù)登場,解密十余項(xiàng)AI前沿技術(shù)的最新進(jìn)展。
其中,百度AI技術(shù)平臺體系執(zhí)行總監(jiān)吳甜圍繞百度語言與知識技術(shù)的整體布局,做了詳細(xì)介紹。語言方面,百度大腦推出知識增強(qiáng)語義理解框架ERNIE,以及兼具高準(zhǔn)確、低時(shí)延的機(jī)器同傳技術(shù);知識方面,全面解析基于百度知識圖譜技術(shù)的視頻語義理解能力。同時(shí),重磅推出行業(yè)知識圖譜平臺和智能創(chuàng)作平臺2.0兩大應(yīng)用級平臺。
核心算法全面升級 保持業(yè)界領(lǐng)先水平
在語言與知識技術(shù)中,語義理解是重要的基礎(chǔ)之一。吳甜介紹了近期百度大腦在語義理解上的重要突破,推出基于知識增強(qiáng)的語義理解框架ERNIE。“不僅在學(xué)術(shù)界的公開數(shù)據(jù)集上,ERNIE也一直在百度實(shí)際的應(yīng)用中展現(xiàn)實(shí)力,比如智能問答、CPR預(yù)估、文本潤色、對話理解等等,”吳甜說到。截至目前,ERNIE已經(jīng)學(xué)習(xí)了超10億知識。由此,ERNIE全面刷新中文NLP任務(wù)的效果,成為業(yè)界效果最好的語義理解框架,幫助AI更深度地理解真實(shí)世界。

機(jī)器同傳方面也有最新進(jìn)展,在翻譯過程中對語音識別結(jié)果進(jìn)行糾錯(cuò)的聯(lián)合詞向量編碼技術(shù),可解決翻譯一致性和連貫性問題的語篇翻譯模型等,結(jié)合先進(jìn)的語音技術(shù),百度大腦實(shí)現(xiàn)了高準(zhǔn)確、低時(shí)延的端到端機(jī)器同傳技術(shù)。在本次大會上,現(xiàn)場聽眾掃描二維碼,即可通過手機(jī)同步收聽機(jī)器同傳流暢、自然播報(bào)的聲音,獲得沉浸式體驗(yàn)。
知識,能幫助AI更深度地理解真實(shí)世界。在主論壇中,王海峰用近期熱映的音樂紀(jì)錄片《大河唱》,形象展示了融合百度知識圖譜技術(shù)的視頻語義理解能力。該技術(shù)通過對視頻的多模態(tài)知識解析,在多元異構(gòu)知識圖譜上建立關(guān)聯(lián),并通過計(jì)算推理,建立對視頻的深度語義理解。
解密百度語言與知識技術(shù)平臺全貌
百度在語言與知識技術(shù)方面的重大更新,依靠的是在該領(lǐng)域的長期積累?,F(xiàn)場,吳甜展示了百度語言與知識技術(shù)開放平臺的全景圖,其中不僅有豐富的基礎(chǔ)技術(shù),還有包括翻譯開放平臺、UNIT平臺、行業(yè)知識圖譜平臺和智能創(chuàng)作平臺在內(nèi)的4個(gè)應(yīng)用級平臺。
“從使用規(guī)模、便捷性和價(jià)值來看,這是NLP和知識技術(shù)大生產(chǎn)平臺。”吳甜這樣介紹百度語言與知識技術(shù)開放平臺。30多項(xiàng)技術(shù)供給,多樣、靈活、可定制的服務(wù)方式,多套場景技術(shù)方案以及全面領(lǐng)先的多語言與知識技術(shù),包括最好的中文語義理解框架ERNIE以及最大的多元語義知識圖譜等,使得平臺具有很好的便捷性價(jià)值。目前,平臺日均調(diào)用量達(dá)千億級,吸引了20萬開發(fā)者,綜合規(guī)模巨大。今年,百度基于飛槳(PaddlePaddle)平臺正式開源了百度多年積累的中文NLP工具和數(shù)據(jù)集Paddle NLP,吳甜表示,Paddle NLP的發(fā)布是開源、開放、大生產(chǎn)平臺階段一個(gè)重要的里程碑。
應(yīng)用級平臺再升級:行業(yè)知識圖譜、智能創(chuàng)作2.0
在吳甜的發(fā)言中,兩大應(yīng)用級平臺的重磅新發(fā)布作為壓軸戲登場,一是行業(yè)知識圖譜平臺,二是智能創(chuàng)作平臺2.0。
行業(yè)知識圖譜平臺基于領(lǐng)先的知識圖譜核心技術(shù),提供智能高效的知識生產(chǎn)流程、低成本啟動和跨行業(yè)遷移的能力,幫助產(chǎn)業(yè)開發(fā)者定制行業(yè)知識圖譜并應(yīng)用。
行業(yè)智能化的大量需求,對行業(yè)知識的積累和應(yīng)用帶來了巨大的挑戰(zhàn)。后者的知識構(gòu)建通常需要領(lǐng)域?qū)<覅⑴c,而傳統(tǒng)知識圖譜耗時(shí)、耗力、成本高。吳甜進(jìn)一步解釋道,百度打造了行業(yè)知識圖譜平臺,旨在能通過百度自身積累的知識圖譜技術(shù),實(shí)現(xiàn)行業(yè)知識自動獲取和應(yīng)用,助力企業(yè)實(shí)現(xiàn)智能化升級。百度行業(yè)知識圖譜具有深入復(fù)雜和專業(yè)兩大特點(diǎn),且具備遷移學(xué)習(xí)能力,低成本啟動,能幫助產(chǎn)業(yè)開發(fā)者定制行業(yè)知識圖譜并應(yīng)用。
同時(shí),吳甜還向現(xiàn)場觀眾介紹了升級后的百度大腦智能創(chuàng)作平臺2.0。如果說去年百度世界大會上發(fā)布且在今年4月完成能力全面開放的智能創(chuàng)作平臺1.0,是讓創(chuàng)作者從枯燥和繁忙的“趕稿”日常中解放出來,那么2.0版本塑造的是更智能、更貼心的自動創(chuàng)作服務(wù)。據(jù)吳甜所說,智能創(chuàng)作平臺2.0具有三大特點(diǎn)。
一是實(shí)時(shí)熱點(diǎn)關(guān)聯(lián)豐富素材,以知識圖譜為基礎(chǔ),提供熱點(diǎn)事件、熱詞關(guān)聯(lián)和事件脈絡(luò)等不同角度的素材,包含文本、圖片、視頻等多種模態(tài),為創(chuàng)作者提供新鮮、實(shí)用的創(chuàng)作靈感和素材支持,讓撰稿者不再談“熱點(diǎn)”色變。二是全面的創(chuàng)作輔助能力,該平臺提供了全面的創(chuàng)作輔助能力,例如快速創(chuàng)作時(shí)效性內(nèi)容的自動創(chuàng)作功能、幫助創(chuàng)作者優(yōu)化文字細(xì)節(jié)的糾錯(cuò)和潤色功能、在發(fā)布內(nèi)容前補(bǔ)充信息的自動標(biāo)簽和摘要功能等。三是領(lǐng)先的多模生成技術(shù),以短視頻為例,多模態(tài)是內(nèi)容創(chuàng)作的重要趨勢。綜合利用百度視覺、語音、文本的多模態(tài)理解能力,百度研發(fā)了自動根據(jù)圖文創(chuàng)作視頻,以及根據(jù)視頻創(chuàng)作圖文的先進(jìn)技術(shù)。這些技術(shù)可以幫助創(chuàng)作者高效完成多種模態(tài)的內(nèi)容生產(chǎn)。
語言與知識技術(shù)是機(jī)器與人交流、理解真實(shí)世界的重要基礎(chǔ),百度大腦在此方面的系列創(chuàng)新,拉近了人與機(jī)器的距離。在最后,吳甜在大屏幕上用了“突破創(chuàng)新、開源開放、智見未來”十二個(gè)大字,結(jié)束了她的演講。這也是百度在語言與知識技術(shù)領(lǐng)域的長期發(fā)展目標(biāo),將持續(xù)為開發(fā)者和相關(guān)領(lǐng)域提供更好的技術(shù)支持。
從該場論壇來看,百度大腦5.0已經(jīng)打通了從基礎(chǔ)層的深度學(xué)習(xí)技術(shù)到通用AI能力、應(yīng)用技術(shù)方案,再到定制化模型,以及最終的部署和集成,整個(gè)人工智能產(chǎn)業(yè)化應(yīng)用落地的全部流程,實(shí)現(xiàn)了AI技術(shù)的標(biāo)準(zhǔn)化、自動化和模塊化。而這股打通“任督二脈”的“神功”,百度正在開放給更多開發(fā)者,希望大家都能平等便捷地獲取AI能力,加速產(chǎn)業(yè)智能化進(jìn)程。