科技范兒十足的百度AI開發(fā)者大會,連喝茶都不走尋常路……
“茶博士,給我來杯茶。”
“客官,喝茶前先為您展示一段長嘴壺茶藝表演怎么樣?”
“好啊,你都會什么茶藝?”
“我會的可多了,您要看哪一個:鳳舞九天、春風(fēng)拂面……魚躍龍門”
“就這個吧”
“好嘞,您瞧好了 ”
……
“茶博士”移動到茶桌附近,以一招精湛的“魚躍龍門”,將長嘴茶壺揮舞在空中旋轉(zhuǎn)。一氣呵成,完成長嘴茶壺倒茶的系列動作。

7月3日,百度CTO王海峰博士在“Baidu Create 2019”百度AI開發(fā)者大會主論壇上,與“茶博士”的逗趣互動十分搶戲,這個獲得滿堂喝彩的“茶博士”其實是一個機械臂。
這個茶藝機械臂,背后是機器人視覺、語音、自然語言處理等多個領(lǐng)域的人工智能技術(shù)的賦能。通過綜合運用這些AI技術(shù),百度打造了一個可以語音交互,又擁有高超茶藝水平的茶藝機器人。
茶藝機器人的伶俐言辭要歸功于百度的語音能力,以及智能對話系統(tǒng)訓(xùn)練和服務(wù)平臺UNIT。在語音方面,基于百度大腦流式多級截斷注意力模型(SMLTA)使茶藝機器人的語音識別速度和準確度大幅提升,而茶藝機器人能夠流利的回答,是借助百度大腦風(fēng)格遷移的語音合成技術(shù),僅需20句話就可以制作一個人的專屬聲音,不僅保留語音中的音色、風(fēng)格、情感等要素,使用時還可任意組合、靈活控制。而UNIT平臺則為茶藝機器人提供業(yè)界領(lǐng)先的對話理解和對話管理技術(shù),比如準確理解用戶指令的強大的泛化理解能力,根據(jù)TTS播報的打斷位置,判斷用戶指代的列表項,做出精確反應(yīng)等,UNIT平臺與語音的融合,可以讓人與茶藝機器人進行智能對話互動。
茶藝機器人想要動作瀟灑、揮灑自如,則要借助3D視覺跟蹤技術(shù)。這一技術(shù)可實時檢測茶杯三維位置信息,即使顧客任意放置水杯,它也能精準獲取杯子位置。此外,根據(jù)長嘴壺的特殊形狀及其特定的水流出水方式,茶藝機器人能自動生成合理的茶壺運動軌跡,出色完成無水濺出的倒茶效果。
短短2分鐘的表演,背后是百度大腦AI技術(shù)的雄厚積累。從產(chǎn)業(yè)的角度看,想要實現(xiàn)類似的效果,需要技術(shù)儲備的寬度和技術(shù)打磨的深度。今年的百度AI開發(fā)者大會上,作為百度AI多年技術(shù)積累和業(yè)務(wù)實踐的集大成,百度大腦正式升級為5.0,成為軟硬一體的AI大生產(chǎn)平臺,為產(chǎn)業(yè)開發(fā)者帶來更多可能,讓他們能借助AI技術(shù)實現(xiàn)產(chǎn)業(yè)的智能化升級,打造新業(yè)態(tài)。
未來的AI,充滿想象!今天的機器人擅長茶藝表演,明天的機器人或許會做大碗寬面,后天……小二,來一碗大碗茶配大碗寬面!