10月21日,第六屆世界互聯(lián)網(wǎng)大會(huì)進(jìn)入第二天。下午,以眼下大熱的人工智能為主題的分論壇“人工智能:開啟智能經(jīng)濟(jì)新時(shí)代”,吸引了眾多關(guān)注該領(lǐng)域發(fā)展現(xiàn)狀及未來的聽眾?,F(xiàn)場(chǎng)座無虛席,連通道上都擠滿慕名而來的聽眾,堪稱本屆大會(huì)的“人氣王”。百度CTO王海峰出席AI論壇并帶來了“一攬子”技術(shù)干貨。

百度是國(guó)內(nèi)投入最早、技術(shù)最強(qiáng)、布局最完整的人工智能領(lǐng)軍企業(yè)。作為百度人工智能多年技術(shù)積累和產(chǎn)業(yè)實(shí)踐的集大成,百度大腦實(shí)現(xiàn)了AI算法、計(jì)算架構(gòu)和應(yīng)用場(chǎng)景的融合創(chuàng)新,成為“軟硬一體AI大生產(chǎn)平臺(tái)”,以飛槳深度學(xué)習(xí)平臺(tái)為基礎(chǔ)底座,以百度智能云為載體,賦能各行各業(yè)的智能化升級(jí)。截至目前,百度大腦已開放216項(xiàng)核心AI能力,日調(diào)用量突破1萬億次,開發(fā)者超過150萬,產(chǎn)業(yè)用戶發(fā)布模型超過16.9萬個(gè)。
在演講中,王海峰分享了對(duì)人工智能技術(shù)的通用性特征,以及人工智能進(jìn)入工業(yè)大生產(chǎn)階段的思考,介紹了百度大腦作為“軟硬一體AI大生產(chǎn)平臺(tái)”的領(lǐng)先技術(shù)能力、飛槳深度學(xué)習(xí)平臺(tái)的優(yōu)勢(shì)、以及產(chǎn)業(yè)智能化的豐富成果。他表示,以深度學(xué)習(xí)為核心基礎(chǔ)的新一代人工智能技術(shù),是新一輪科技革命和產(chǎn)業(yè)變革的核心驅(qū)動(dòng)力量,呈現(xiàn)出標(biāo)準(zhǔn)化、自動(dòng)化和模塊化的通用性特征,開始進(jìn)入工業(yè)大生產(chǎn)階段,加速各行各業(yè)的智能化進(jìn)程。
以下為王海峰AI論壇演講實(shí)錄:
各位領(lǐng)導(dǎo)、各位專家、各位來賓,大家下午好!
我跟大家分享的題目是《人工智能進(jìn)入工業(yè)大生產(chǎn)階段》,我知道這個(gè)論壇的主題是“人工智能:開啟智能經(jīng)濟(jì)新時(shí)代”,怎么開啟?我的觀點(diǎn)是如果想讓人工智能更快地、更有效地助力經(jīng)濟(jì)的發(fā)展,需要讓人工智能真正像工業(yè)大生產(chǎn)的方式進(jìn)入各行各業(yè)的生產(chǎn)環(huán)節(jié),進(jìn)而推動(dòng)整個(gè)生產(chǎn)力的進(jìn)步,也推動(dòng)社會(huì)的進(jìn)步。
為了論述我剛才講的工業(yè)大生產(chǎn)階段,我們先回顧一下人類歷史上已經(jīng)發(fā)生過的幾次工業(yè)革命。我們都知道從200多年以前開始,人類歷史上已經(jīng)發(fā)生了三次工業(yè)革命,分別為人類帶來機(jī)械技術(shù)、電力技術(shù)和信息技術(shù),而且每一次工業(yè)革命的核心技術(shù)都不限于某一個(gè)行業(yè),而是廣泛應(yīng)用于各行各業(yè),應(yīng)用于人類的工業(yè)大生產(chǎn),進(jìn)而改變了人們的生產(chǎn)方式、生活方式甚至思維方式。
工業(yè)大生產(chǎn)的技術(shù)有非常強(qiáng)的通用性,這些技術(shù)也呈現(xiàn)出一些顯著的特征,比如標(biāo)準(zhǔn)化、自動(dòng)化和模塊化。所以,我認(rèn)為一個(gè)技術(shù)同時(shí)擁有標(biāo)準(zhǔn)化、自動(dòng)化和模塊化的特征,可以影響各行各業(yè),就具備進(jìn)入工業(yè)大生產(chǎn)階段的一些基本前提。
人工智能是新一輪科技革命和產(chǎn)業(yè)變革的核心驅(qū)動(dòng)力量。百度大腦是百度多年人工智能技術(shù)積累和業(yè)務(wù)實(shí)踐的集大成,我們從2010年左右就開始布局人工智能相關(guān)的各種基礎(chǔ)能力,經(jīng)過多年的積累,在2016年形成初步完善的布局,因而發(fā)布百度大腦1.0。發(fā)展到今年,百度大腦不僅僅有很強(qiáng)的跟AI相關(guān)的各方面“軟”能力,同時(shí)也開始進(jìn)入工業(yè)大生產(chǎn)的階段。一方面,百度大腦更多地在與硬件,比如跟芯片、硬件平臺(tái)進(jìn)行結(jié)合,形成軟硬一體的平臺(tái);另一方面,是我之后會(huì)提到的關(guān)于這些技術(shù)也逐漸具備了標(biāo)準(zhǔn)化、模塊化、自動(dòng)化的特征,而且已經(jīng)開始應(yīng)用于各行各業(yè),顯示出通用性。
百度AI大生產(chǎn)平臺(tái)的一些基本架構(gòu)包括基本的算力和數(shù)據(jù),深度學(xué)習(xí)平臺(tái)中的核心框架、工具組件、服務(wù)平臺(tái);上面有各種相對(duì)通用的AI能力,比如跟人的視覺、聽覺和感知相關(guān)的計(jì)算機(jī)視覺技術(shù)、語音技術(shù),同時(shí)也包括跟人的認(rèn)知相關(guān)的自然語言處理、知識(shí)圖譜等基礎(chǔ)技術(shù)。在此基礎(chǔ)上,還要有定制的訓(xùn)練平臺(tái),比如面向各種垂直場(chǎng)景的應(yīng)用技術(shù)進(jìn)行定制化的平臺(tái),此外還有適用于多種場(chǎng)景的多端部署能力,包括云上、端上、邊緣上以及各種各樣的設(shè)備上,從而形成AI的解決方案。
我剛才講的第一點(diǎn)就是深度學(xué)習(xí)的平臺(tái),我認(rèn)為深度學(xué)習(xí)框架和平臺(tái)是AI時(shí)代的操作系統(tǒng)。一方面,它向下對(duì)接硬件、芯片,而且為了達(dá)到更好的效果,芯片是需要針對(duì)深度學(xué)習(xí)框架技術(shù)進(jìn)行定制優(yōu)化,從而達(dá)到軟硬一體優(yōu)化的更優(yōu)效果;而向上,深度學(xué)習(xí)框架和平臺(tái)承接各種應(yīng)用,它相當(dāng)于處在一個(gè)比較核心的承上啟下位置。所以,我認(rèn)為它是“智能時(shí)代的操作系統(tǒng)”。
百度深度學(xué)習(xí)平臺(tái)飛槳經(jīng)過多年打磨,已形成完善布局,包括基礎(chǔ)框架,無論是開發(fā)、訓(xùn)練還是預(yù)測(cè);產(chǎn)業(yè)實(shí)踐打磨的模型庫;端到端的開發(fā)套件、工具組件和服務(wù)平臺(tái)。飛槳是一套很龐大的架構(gòu),其中有幾個(gè)方面是我們認(rèn)為很重要、很領(lǐng)先的技術(shù),開發(fā)方面具有開發(fā)便捷的深度學(xué)習(xí)框架;訓(xùn)練方面能支持超大規(guī)模深度學(xué)習(xí)模型訓(xùn)練的技術(shù);還有多端多平臺(tái)部署的高性能的推理引擎以及產(chǎn)業(yè)級(jí)的模型庫。
開發(fā)方面,一方面是組網(wǎng)的編程范式更符合程序員寫程序的習(xí)慣,所以程序員開發(fā)起來非常方便,而且它同時(shí)支持動(dòng)態(tài)圖和靜態(tài)圖,兼具靈活性和穩(wěn)定性的優(yōu)勢(shì)。另一方面,為了更好設(shè)計(jì)神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu),我們開發(fā)了自動(dòng)化的網(wǎng)絡(luò)設(shè)計(jì),現(xiàn)在這種自動(dòng)設(shè)計(jì)出來的網(wǎng)絡(luò)已經(jīng)超越了人類專家設(shè)計(jì)的網(wǎng)絡(luò)的效果。
而超大規(guī)模的深度學(xué)習(xí)訓(xùn)練技術(shù)已經(jīng)能支持萬億級(jí)參數(shù)模型的訓(xùn)練,而且可以做到實(shí)時(shí)更新。訓(xùn)練出模型以后,我們需要部署、應(yīng)用,進(jìn)行各種推理,這時(shí)候涉及到多端多平臺(tái)的部署能力,而且為了在各種場(chǎng)景當(dāng)中應(yīng)用得更好,也做了通用架構(gòu)推理速度的優(yōu)化。
有了這些基礎(chǔ)框架,無論是開發(fā)、訓(xùn)練還是推理的能力,在真正應(yīng)用的時(shí)候需要針對(duì)各種場(chǎng)景建構(gòu)各種模型。基于此,飛槳也提供了非常全面的官方支持,經(jīng)過產(chǎn)業(yè)驗(yàn)證的工業(yè)級(jí)的模型庫,而且這種模型庫一方面在產(chǎn)業(yè)應(yīng)用中得到很多驗(yàn)證,另外一方面也參加了國(guó)際標(biāo)準(zhǔn)測(cè)試,得到很多領(lǐng)先的結(jié)果。
人工智能技術(shù)有感知、認(rèn)知技術(shù),包括語音、視覺、語言和知識(shí)等,這也是百度大腦具備的核心能力。語音方面,我們今年研發(fā)的SMLTA多級(jí)截?cái)嗔魇阶⒁饬δP?,使?zhǔn)確率進(jìn)一步提升,而且不僅在正常的比較安靜、標(biāo)準(zhǔn)的環(huán)境下得到很好的識(shí)別效果,在嘈雜的環(huán)境或者中英文混讀的情況下也能得到很好的效果。如果大家平時(shí)會(huì)用語音輸入,會(huì)發(fā)現(xiàn)你只說中文,可能效果很好,但中英文混說的時(shí)候效果就要差很多,這是由于語音識(shí)別技術(shù)能力所決定的。但是,我們現(xiàn)在不斷地提升模型,將兩種語言混合在一起仍然能得到比較好的效果。
語音合成方面,如果僅僅能夠讓人聽清楚、聽得明白,這不是特別難的事,但如果聽得很流暢、很舒服而且有不同的音色、風(fēng)格、情感等,難度就大大提升了。我們研發(fā)的語音合成技術(shù),可以將這些要素分別解耦、分別訓(xùn)練,最后形成統(tǒng)一的聲音。這時(shí)候不僅讓聲音的自然度更好,同時(shí)也可以進(jìn)行各種定制。
如果大家用過地圖的導(dǎo)航,知道一般地圖會(huì)提供一些標(biāo)準(zhǔn)的聲音,但你要想用你的孩子、親人、朋友或者用任何其他人的定制的聲音,并不容易實(shí)現(xiàn)。但基于我們現(xiàn)在最新研制的語音合成技術(shù),任何人只要在百度地圖app上對(duì)著手機(jī)說20句話,就可以為你定制模擬說話人聲音的合成音。比如你開車的時(shí)候,就可以用你孩子的聲音幫你導(dǎo)航,快速尋找合適的路線。
視覺技術(shù)領(lǐng)域也包括很多方面,比如人臉關(guān)鍵點(diǎn)的識(shí)別等,這可以做3D技術(shù),比如這是一個(gè)虛擬的主持人。
語言方面,很重要的一點(diǎn)是語義理解,我們研制的持續(xù)學(xué)習(xí)語義理解框架ERNIE,不僅包含深度學(xué)習(xí)技術(shù),同時(shí)也加入了知識(shí)、知識(shí)圖譜等,讓ERNIE得到了非常好的效果。
此外,還有交互的技術(shù),比如說百度的對(duì)話式交互平臺(tái)已經(jīng)有6萬多個(gè)定制技能,累計(jì)交互已有500多億次。再有是兩種語言之間的翻譯,我們首創(chuàng)語義單元驅(qū)動(dòng)的上下文感知翻譯模型,而且不僅翻譯準(zhǔn)確,實(shí)時(shí)性更好。
所有百度AI技術(shù),我們已經(jīng)通過百度大腦開放平臺(tái)以及飛槳開源開放平臺(tái)全面開放,大家都可以基于這些平臺(tái)開發(fā)自己的產(chǎn)品、發(fā)展自己的業(yè)務(wù)。另一方面,我們也依托百度智能云,可以更好地將軟硬一體、包括數(shù)據(jù)、算法、算力結(jié)合起來,共同部署這些AI能力。
當(dāng)然,提到AI,安全方面也非常重要。百度AI安全方面也形成一個(gè)完整的布局,從基礎(chǔ)層到平臺(tái)層再到生態(tài)層都有很多布局,大家有興趣可以進(jìn)一步了解。
整體上,百度AI大生產(chǎn)平臺(tái)已經(jīng)開放216項(xiàng)能力,每天的調(diào)用量超過萬億次,并有150多萬開發(fā)者和企業(yè)用戶發(fā)布的大量模型。
AI賦能各行各業(yè),幫助各行各業(yè)進(jìn)入工業(yè)大生產(chǎn)時(shí)代。大家可以看到,不管是工業(yè)、農(nóng)業(yè)、服務(wù)業(yè)各方面都可以受益于AI能力。
謝謝大家!
特別提醒:本網(wǎng)內(nèi)容轉(zhuǎn)載自其他媒體,目的在于傳遞更多信息,并不代表本網(wǎng)贊同其觀點(diǎn)。其原創(chuàng)性以及文中陳述文字和內(nèi)容未經(jīng)本站證實(shí),對(duì)本文以及其中全部或者部分內(nèi)容、文字的真實(shí)性、完整性、及時(shí)性本站不作任何保證或承諾,并請(qǐng)自行核實(shí)相關(guān)內(nèi)容。本站不承擔(dān)此類作品侵權(quán)行為的直接責(zé)任及連帶責(zé)任。如若本網(wǎng)有任何內(nèi)容侵犯您的權(quán)益,請(qǐng)及時(shí)聯(lián)系我們,本站將會(huì)在24小時(shí)內(nèi)處理完畢。