7月3日-4日,“Baidu Create 2019”百度AI開發(fā)者大會在北京國家會議中心隆重舉行,大會聚焦產(chǎn)業(yè)智能化,向業(yè)界展示了百度最新的技術(shù)進展和落地實踐。在此次大會的百度AI交互設(shè)計論壇上,百度人工智能交互設(shè)計院院長、百度設(shè)計體驗委員會主席關(guān)岱松與其設(shè)計團隊共同向外界展示了百度人工智能交互設(shè)計院基于深度學(xué)習(xí)的人因工程,以及百度AI交互設(shè)計在無人駕駛、智能硬件、百度大腦、機器人、AR、VR等方面協(xié)同發(fā)展的實踐,并發(fā)布多項最新AI交互設(shè)計成果,不僅包含全新升級的小度交互設(shè)計系統(tǒng),更有AI交互設(shè)計助力產(chǎn)業(yè)智能化的最新探索。同時,三款基于百度自然情感交互系統(tǒng)NIRO開發(fā)的軟硬一體化創(chuàng)新機器人也在現(xiàn)場首次亮相。

以下為演講實錄:
各位開發(fā)者,各位嘉賓,我是百度AI交互設(shè)計院人機探索實驗室的負(fù)責(zé)人,大家上午好。今天大會設(shè)計分論壇的一個重要主題是AI交互設(shè)計如何助力人工智能產(chǎn)業(yè)化升級。服務(wù)機器人產(chǎn)業(yè)在過去幾年中國都有超過35%的增長,而這其中在家庭和公共場所主要功能是教育、娛樂、咨詢、業(yè)務(wù)辦理的服務(wù)機器人正在被越來越多的人接觸到,它們依賴的能力中非常重要的一部分是人機交互能力。

為了提升機器人的人機交互能力,在去年AI Creat 2018我們發(fā)布了機器人的自然情感交互系統(tǒng)NIRO1.0,NIRO1.0包含三個層次:機器人自然語言交互模型、人類情緒應(yīng)對模型、機器人主動交流交互模型,通過這三個模型可以讓機器人的語音交互更高效、能主動服務(wù)、有情商。推動行業(yè)進步的根本途徑是提升體驗,人機交互系統(tǒng)只是體驗的一環(huán),只有和硬件能力相互結(jié)合發(fā)生化學(xué)反應(yīng),才能更有效的提升機器人的體驗。因此在過去一年里我們與百度內(nèi)部多個團隊進行合作,通過軟硬一體化打造了多款機器人產(chǎn)品。今天是這些產(chǎn)品第一次對外展示,大家先睹為快。

第一款產(chǎn)品,“現(xiàn)實版的大白”——公共服務(wù)機器人NIRO-Max,它是百度AI交互設(shè)計院人機探索實驗室以NIRO為基礎(chǔ),從ID、人機交互到結(jié)構(gòu)工程、機械工程,為百度智能云打造的新產(chǎn)品,將在今年第三季度正式推向市場。

目前服務(wù)機器人的主要使用場景是公共區(qū)域,且市場依舊處于非常早期的階段,用戶并沒有在人機交互層形成固定的使用習(xí)慣。因此服務(wù)機器人成功的關(guān)鍵是兩個維度:感官體驗層和使用體驗層,只有它們形成正循環(huán),產(chǎn)品才會越來越多的被使用。

機器人的外觀設(shè)計和其他所有產(chǎn)品都不一樣,根據(jù)日本機器人專家森昌弘“恐怖谷理論”,當(dāng)機器人外觀很接近人時反而會讓人覺得恐怖,這是非常特殊的,因此機器人的外觀設(shè)計不僅是設(shè)計學(xué)更是認(rèn)知科學(xué),比如面部是不是越具象越好?肢體究竟要多完整?為了解決這些問題,在設(shè)計NIRO-Max時我們設(shè)計了幾十種面部和肢體的組合模式,按三個維度進行了14天超過500次的測試,最終找到機器人面部和肢體配比的舒適區(qū)間。并且通過研究發(fā)現(xiàn)機器人頭部形態(tài)如果接近于嬰兒的頭部形態(tài)更能激發(fā)好感。
機器人簡單的外表下隱藏了復(fù)雜的加工工藝和元器件組合,比如為了保障面部透光率和表情均勻,我們重新設(shè)計了噴漆路徑,并在基材加工上做了鏡面拋光和增透處理。為了讓機器人呈現(xiàn)出豐富的表情,我們在機器人這么小的頭部內(nèi)定制了小體積超短焦的激光投影,它的投影比例達到0.3。

如果說機器人的外觀決定了是否能吸引用戶首次使用,那么使用層的體驗將決定它是否被反復(fù)使用。在使用體驗層我們?yōu)闄C器人設(shè)計了兩種交互模型:語音交互模型和主動交互模型。
在語音交互維度,語音交互主要分為遠(yuǎn)場與近場兩個場景,在遠(yuǎn)場使用的交互模型是“喚醒-響應(yīng)-輸入-理解-行動/回答”的交互模型,這種交互模型在智能音箱產(chǎn)品上已經(jīng)打磨的非常成熟。但是服務(wù)機器人的語音交互更多的是在近場發(fā)生,目前主流的喚醒方式有兩種:按鈕喚醒和人臉喚醒,而按鈕喚醒需要尋找(按鈕),不易使用;人臉喚醒易誤喚醒,抗噪能力差。為了解決這些問題,我們?yōu)镹IRO-Max設(shè)計了兩種喚醒方式:多模自然喚醒與觸感喚醒。
多模自然喚醒是利用高清攝像頭判斷用戶是否在和機器人說話,加麥克風(fēng)陣列的定向收音增益,它不僅支持多人嘈雜環(huán)境下的自然喚醒,而且可以隨時打斷。通過這種方式它的交互效率比喚醒詞交互效率提升5%,“喚醒+指令”分開輸入主觀感受體驗提升56.2%,“喚醒+指令”連續(xù)輸入主觀感受體驗提升31.2%。

觸感喚醒模仿的是人與人之間通過觸摸來喚醒彼此的方式,NIRO-Max通過頭部、肩部、手臂、手掌共7塊觸感傳感器,來支持觸摸喚醒。觸感喚醒不但還原了人類自然的喚醒方式之一,還可以增強趣味性,拉近用戶與產(chǎn)品的距離。

主動交互通過減少用戶輸入來提高服務(wù)效率,而主動交互的難點在于在什么場景下要用什么形式進行什么程度的主動交互。NIRO-Max根據(jù)機器人的與用戶的距離、機器人的狀態(tài),設(shè)計了三種主動交互方式:主動詢問、主動展示、自主巡航。

主動詢問是當(dāng)用戶走向機器人正面小于1.3m時,這時候?qū)τ脩粜枰?wù)推斷是比較準(zhǔn)確的,機器人會根據(jù)當(dāng)前位置、人臉識別等信息主動詢問某項服務(wù)。而當(dāng)用戶與機器人的距離處于中場,當(dāng)檢測到有過往用戶在1.3m到3m之間慢速行走并看向機器人,或停下來看向機器人時,機器人主動展示自身能力并詢問是否需要(服務(wù))。
主動巡航的基礎(chǔ)是3攝像頭+雙雷達感知能力,基于這種能力,NIRO-Max可以根據(jù)設(shè)定路線巡航并在人群聚集處停留一段時間,通過界面播放服務(wù)內(nèi)容,這大大提高了機器人的覆蓋區(qū)域。

機器人的功能層質(zhì)量以體驗層為基礎(chǔ),感觀層通過科學(xué)的設(shè)計做到強的交互意愿度,在使用層以NIRO系統(tǒng)為基礎(chǔ),通過自然喚醒、主動交互讓機器人可以有高效的交互、更多的服務(wù)時間。

在過去一年基于NIRO的設(shè)備不止于此,還有會議室智能助理機器人NIRO-Hi,通過內(nèi)置NIRO它可以實現(xiàn)一步撥打語音電話,以及語音交互智能屏機器人NIRO-View,它可以實現(xiàn)多人全自然的語音交互、主動展示信息,還有剛剛展示過的NIRO-Key可以通過預(yù)識別實現(xiàn)無停留通行,它們都是基于NIRO的軟硬一體化創(chuàng)新,通過NIRO它們都能實現(xiàn)更自然的語音交互、主動服務(wù)用戶、有情商,而越來越多的設(shè)備使用NIRO也推動了NIRO能力的提升。
通過一年與機器人產(chǎn)品的軟硬一體化結(jié)合應(yīng)用,不斷的實踐升級探索,今天我們將推出增強版的NIRO——NIRO2.0。NIRO2.0從即日起開放申請,它將擴展兩方面的能力。第一,機器人的自然語音交互模型由單人擴展為多人,這種能力從即日起可以使用。第二,新加入了機器人的自然動作引擎,可以讓機器人的動作流暢自然且在動作幅度、速度上具備一定隨機性,這種能力是今年8月開放使用。目前前面所列舉的機器人產(chǎn)品的人機交互系統(tǒng)已升級為NIRO2.0,也歡迎大家訪問NIRO官網(wǎng)獲得這些能力。希望越來越多的NIRO設(shè)備可以被創(chuàng)造。
謝謝大家!