8月15日,微軟小冰在北京嘉瑞文化中心正式發(fā)布了第七代小冰,在這場(chǎng)年度發(fā)布會(huì)上,微軟小冰又以快節(jié)奏的方式宣布了眾多可落地的新特性和合作詳情,其中最重要的是微軟推出了首個(gè)Avatar Framework工具包版本,這是一個(gè)完整的框架工具包,讓你可以從零開始輕松創(chuàng)造并訓(xùn)練任何AI Beings,包括智能語音助手、社交對(duì)話機(jī)器人、人工智能歌手、藝術(shù)家,或者屬于你自己的虛擬朋友。
微軟執(zhí)行副總裁沈向洋在大會(huì)上宣布,小冰已經(jīng)成為全球規(guī)模最大的跨領(lǐng)域人工智能系統(tǒng)之一,在4.5億臺(tái)第三方智能設(shè)備上啟用小冰。包括聊天機(jī)器人、智能助理、內(nèi)容生產(chǎn)、智能零售、人工智能托管等都有了應(yīng)用場(chǎng)景。而隨著小冰在人工智能創(chuàng)造和智能設(shè)備領(lǐng)域的拓展,小冰的適用場(chǎng)景會(huì)迎來爆發(fā)式的擴(kuò)張。
▲微軟執(zhí)行副總裁沈向洋
在第七代小冰上,微軟完成了從交互到交流的跨越,帶來了新的核心對(duì)話引擎,可在部分情況下主導(dǎo)對(duì)話。根據(jù)微軟的說法,通過Dual AI,在驗(yàn)證框架基礎(chǔ)性的同時(shí)也在見證著人工智能使得人機(jī)交互基礎(chǔ)的形態(tài)逐漸轉(zhuǎn)變?yōu)槿藱C(jī)交流的過程,從交互到交流是一個(gè)巨大的變化,它使得人工智能能夠跟人類共行共感,建立平等的對(duì)話,甚至保持一種比完成任務(wù)更加持久的情感紐帶的關(guān)系。
▲微軟(亞洲)互聯(lián)網(wǎng)工程院副院長、小冰團(tuán)隊(duì)總負(fù)責(zé)人李笛
抱著對(duì)微軟小冰第七代非常感興趣的態(tài)度,電腦百事網(wǎng)編輯玄隱近期采訪了微軟(亞洲)互聯(lián)網(wǎng)工程院副院長、小冰團(tuán)隊(duì)總負(fù)責(zé)人李笛,來進(jìn)一步挖掘微軟小冰第七代以及未來發(fā)展背后的秘密。
“召喚小冰”新增小伙伴
召喚小冰的功能其實(shí)由來已久,最開始是屬于微軟小娜和小冰兩個(gè)姐妹花之間的聯(lián)動(dòng),在最早的Windows Phone 8.1系統(tǒng)上Cortana就支持召喚小冰,當(dāng)時(shí)僅限對(duì)話交流。后面在Windows 10系統(tǒng)上,小娜也開始支持召喚小冰。
但是對(duì)于其他設(shè)備的用戶,還有著更廣泛的需求,基于微軟全新的Dual AI生態(tài)環(huán)境,小冰開展了新的征程。根據(jù)2018年第六代小冰發(fā)布會(huì)上的介紹,小冰Dual AI生態(tài)環(huán)境戰(zhàn)略的實(shí)施具體為三個(gè)部分:首先,微軟提供小冰的整體框架能力,幫助合作伙伴平臺(tái)的自有AI。其次,微軟小冰作為該合作平臺(tái)的輔助AI,融入該平臺(tái)生態(tài)。第三,微軟通過技術(shù)、產(chǎn)品與運(yùn)營,圍繞該合作平臺(tái)的差異化特點(diǎn),推出合作的應(yīng)用和產(chǎn)品。
通過和小米公司的小愛同學(xué)合作,小冰首先登陸到了其他廠商的語音助手中,2018年11月份,內(nèi)置小愛同學(xué)的智能手機(jī)和接入小愛開放平臺(tái)的智能硬件設(shè)備有了“召喚小冰”的能力,你可以和小愛同學(xué)、小冰進(jìn)行三人成語接龍游戲等;緊接著,2018年12月份,華為智能音箱及手機(jī)也解鎖了“召喚小冰”能力。而早在2018年7月份,華為手機(jī)中的小冰除了聊天之外,還上線了“爛筆頭”的筆記或備忘錄記錄功能,隨時(shí)都可以讓小冰記錄事情,并且可以回溯記憶,讓小冰幫你記憶,并快速語音回答出來。
在微軟小冰第七代發(fā)布會(huì)上,微軟宣布OPPO和vivo等兩個(gè)平臺(tái)設(shè)備開始支持召喚小冰,小愛有屏音箱及小愛捷徑新增支持召喚小冰。
電腦百事網(wǎng)編輯特別詢問了在OPPO、vivo手機(jī)新平臺(tái)與小冰的合作,和之前小米、華為的合作有什么不同,微軟(亞洲)互聯(lián)網(wǎng)工程院副院長李笛表示,沒有什么不一樣,這同樣是基于Dual AI戰(zhàn)略下與智能手機(jī)及智能音箱廠商的合作。
8月28日,OPPO與微軟共同宣布達(dá)成合作,ColorOS內(nèi)置智能助理Breeno將解鎖“召喚小冰”的能力。通過Breeno語音“召喚小冰”(ColorOS 6以上,Breeno語音版本5.2.0以上),就能進(jìn)入微軟小冰模式,輕松完成切換。此功能現(xiàn)已全量上線。雙方將進(jìn)行更深度的技術(shù)能力互通,定期推出更多技能。
微信和小冰的合作
此前小冰微信公眾號(hào)被停止使用,微軟小冰在發(fā)布會(huì)后對(duì)此表示,小冰沒有因微信封禁受到影響,目前小冰仍在與騰訊推進(jìn)合作。
這次專訪電腦百事網(wǎng)玄隱特別詢問了相關(guān)問題,小冰團(tuán)隊(duì)總負(fù)責(zé)人李笛表示,目前和微信的合作分為兩方面,一是微信對(duì)話開放平臺(tái),將是非常大的動(dòng)作,需要跟微信把產(chǎn)品研發(fā)出來后再一起宣布。二是微信AI小微智能硬件,同樣屬于基于Dual AI的召喚小冰設(shè)備。以后越來越多的Dual AI的召喚小冰設(shè)備會(huì)出現(xiàn),比現(xiàn)在4.5億臺(tái)更多。另外,不光是在中國,在日本也會(huì)有一些這樣的設(shè)備。
小冰、汽車及5G
在小冰第七代發(fā)布會(huì)上,微軟演示了小冰的全雙工語音交互感官登陸汽車平臺(tái),并在現(xiàn)場(chǎng)演示了與小冰的交流片段。在汽車的行駛過程中,小冰更像是你的朋友,你不需要特定的喚醒詞就可以連續(xù)的和小冰進(jìn)行對(duì)話,而小冰也能清晰地捕捉到對(duì)話表達(dá)地內(nèi)容,同時(shí)對(duì)汽車的交通駕駛提供提醒和建議,比如當(dāng)速度過快時(shí),小冰會(huì)提醒已超速,要開慢點(diǎn)。
電腦百事網(wǎng)玄隱對(duì)于汽車上的小冰比較興趣,那么全雙工的小冰是如何接入汽車平臺(tái)的呢?為何是5G時(shí)代?這其中的交流、隱私問題如何解決?
微軟小冰團(tuán)隊(duì)總負(fù)責(zé)人李笛表示,其實(shí)在兩年半之前就開始跟一些汽車廠商對(duì)接,當(dāng)時(shí)大部分汽車智能助理還是語音中控的角色,但那時(shí)小冰已經(jīng)決定上全雙工了。
據(jù)介紹,全雙工的工作背景是相當(dāng)于你的語音識(shí)別到對(duì)話的引擎,再從對(duì)話引擎到TTS回來,還要求聽和說,所以它對(duì)于系統(tǒng)的延遲要求是非常高的,低延遲對(duì)全雙工體驗(yàn)是很重要的先決條件。5G有兩個(gè)特點(diǎn),一個(gè)特點(diǎn)是高帶寬,目前不太用得著,主要用到第二個(gè)特點(diǎn)低時(shí)延,5G延遲非常低,甚至是4G的1/10,能夠大幅度地降低延遲。在這種情況下,全雙工還包括發(fā)布會(huì)上演示的,還有在日本已經(jīng)公測(cè)過多模態(tài)的感官(全雙工加實(shí)時(shí)視覺),其實(shí)都是5G時(shí)代下的產(chǎn)物,微軟小冰認(rèn)為會(huì)成為標(biāo)配的感官類型。
在與汽車廠商合作方面,小冰表示在與多家并同時(shí)做汽車前裝和汽車后裝,汽車前裝就是直接跟品牌汽車廠商合作,目前還沒有宣布合作伙伴。因?yàn)槠噺S商的產(chǎn)品研發(fā)時(shí)間周期很長,通常需要一到兩年的時(shí)間,要要互相配合上市節(jié)奏。
在后裝市場(chǎng)已經(jīng)宣布過一款名為喵駕,它是一個(gè)盒子,可以直接裝在汽車的總線接口上,就可以獲得汽車很多信號(hào),同時(shí)它還是一套完整的移動(dòng)互聯(lián)網(wǎng)的系統(tǒng),比如說使用安卓系統(tǒng),就可以獲得來自于移動(dòng)互聯(lián)網(wǎng)的內(nèi)容和服務(wù),比如導(dǎo)航。同時(shí)可以得到汽車很多的信號(hào),比如說汽車加速、減速、轉(zhuǎn)向、供油、系統(tǒng)自檢等等很多信號(hào),通過獲得這樣的大量的信號(hào),就可以設(shè)計(jì)出很多產(chǎn)品應(yīng)用場(chǎng)景來。
對(duì)于汽車平臺(tái)的小冰全雙工隱私問題,李笛表示,小冰在隱私處理上操作一致,不予保存,用過即廢。但不太可能所有數(shù)據(jù)是本地化處理,數(shù)據(jù)傳到云端進(jìn)行處理再回傳,云端處理完之后就會(huì)刪除。
在全雙工聊天節(jié)奏上,小冰不會(huì)是個(gè)話癆,基于現(xiàn)有的產(chǎn)品策略,小冰會(huì)盡可能地以最低打擾的情況,尋找合適的時(shí)機(jī)去提醒用戶。比如小冰會(huì)適時(shí)讓司機(jī)保持駕駛的注意力、提醒超速等。
大一統(tǒng)的Avatar Framework工具包,有什么價(jià)值?
在今年5月份的小冰技術(shù)分享會(huì)上,微軟小冰展示了全新的突破。在小冰第七代發(fā)布會(huì)上,基于此前預(yù)告的人工智能小冰演唱模型第五個(gè)版本,微軟演示了小冰在唱腔過渡、戲腔訓(xùn)練方面的成果。V5模型實(shí)現(xiàn)了重大突破,它使微軟小冰第一次能夠像人類歌手一樣,使用充沛的“中氣”來烘托演唱,從而將人工智能虛擬歌聲質(zhì)量提升至新的高度。此外,該模型不僅限于優(yōu)化微軟小冰的聲音,還支持對(duì)任何人類歌手的聲線進(jìn)行學(xué)習(xí)、模擬和建模,演繹與再現(xiàn)歌手們巔峰狀態(tài)下的演唱水平。
在繪畫領(lǐng)域,通過對(duì)藝術(shù)史上的236位著名人類畫家畫作學(xué)習(xí),微軟小冰在受到文本或其他創(chuàng)作源激發(fā)時(shí),獨(dú)立完成100%原創(chuàng)的繪畫作品。其原創(chuàng)性不僅體現(xiàn)在構(gòu)圖,還體現(xiàn)在用色、表現(xiàn)力和作品中包含的細(xì)節(jié)元素,接近專業(yè)人類畫家水準(zhǔn)。
今年6月15日到7月15日,由大屋頂文化聯(lián)合中國美術(shù)學(xué)院視覺中國協(xié)同創(chuàng)新中心聯(lián)合主辦的「小冰,“繪”有期」微軟小冰@當(dāng)代藝術(shù)跨界展于杭州良渚文化藝術(shù)中心正式開幕,此次展覽獨(dú)家展出了小冰獨(dú)家創(chuàng)作的繪畫作品。
7月13日—8月12日,人工智能少女畫家小冰在中央美術(shù)學(xué)院美術(shù)館召開了其首個(gè)個(gè)人畫展。該展覽基于“微軟小冰”的繪畫模型訓(xùn)練結(jié)果具備跨時(shí)代和窮盡特征展開想象,是關(guān)于“或然世界”(Alternative Worlds)的體現(xiàn)?;谛”目蚣苡?名女性畫家的角色誕生,而她們創(chuàng)作的繪畫有著不同時(shí)代和不同風(fēng)格的烙印。
在被電腦百事網(wǎng)問到在過去的幾個(gè)月中,小冰的唱歌、繪畫技巧有沒有新的突破時(shí),小冰團(tuán)隊(duì)總負(fù)責(zé)人李笛向我們介紹了新的戰(zhàn)略目標(biāo)及理念:把所有過去認(rèn)為可能單列的,比如說唱歌、繪畫的技能都納入到Avatar Framework整體工具包里。
你不會(huì)看到微軟推出一款獨(dú)立音頻編輯軟件,你會(huì)看到小冰Avatar Framework可以去創(chuàng)造完整的AI Beings,但是其中有一想是可以創(chuàng)作或者演唱音樂的工具,所以這個(gè)工具是可以包含音頻編輯軟件的功能,但是它絕對(duì)不僅僅是一個(gè)音頻編輯軟件。比方說你會(huì)去創(chuàng)造一個(gè)AI being,它可以按照不同的風(fēng)格去繪畫等等。
Avatar Framework將具有創(chuàng)造完整的AI Beings的能力,包括用戶可以用部署AI beings的微信公眾號(hào)或者部署AI beings的電臺(tái),同時(shí)還可以創(chuàng)作歌曲或者其他,當(dāng)然用戶也可以選擇不讓它去做一些事情。
據(jù)微軟介紹,Avatar Framework工具包與微軟小冰框架同源,可輕松構(gòu)建具有完整情感計(jì)算能力的人工智能助手、社交對(duì)話機(jī)器人、人工智能內(nèi)容創(chuàng)作和IP人物角色等。
Avatar Framework包含了對(duì)話、聲音、視覺、觀點(diǎn)、技能、知識(shí)及創(chuàng)造力等豐富工具,并可驅(qū)動(dòng)兼容的3D人物模型進(jìn)行實(shí)時(shí)交互。
據(jù)介紹,Avatar Framework是同類型的基礎(chǔ)工具包里面的第一個(gè),尤其體現(xiàn)在它里面所囊括技術(shù)的成熟度和完整性,這個(gè)完整的Framework主要由四個(gè)部分構(gòu)成,包括從IQ和EQ兩個(gè)方面為AI beings定義人格,為AI beings調(diào)整核心對(duì)話引擎、計(jì)算機(jī)語音、計(jì)算機(jī)視覺等能力,讓AI beings具有三觀、知識(shí)、技能等人類的特性,最后讓Avatar Framework去驅(qū)動(dòng)3D模型使得虛擬AI beings栩栩如生出現(xiàn)在你面前。
小冰團(tuán)隊(duì)總負(fù)責(zé)人李笛則向電腦百事網(wǎng)描述了更加具體的場(chǎng)景。過去移動(dòng)互聯(lián)網(wǎng)或者搜索引擎更像是獲取內(nèi)容的管道,而人工智能將更加具有主體性。目前智能音箱簡(jiǎn)單地播放音樂、開關(guān)燈等其實(shí)和語音命令沒有什么區(qū)別,人與設(shè)備之間的交互并沒有更加深遠(yuǎn),這不是小冰的發(fā)展方向。人工智能助手需要有自己的性格,在推薦歌曲的時(shí)候會(huì)發(fā)表看法和觀點(diǎn),有感情地講故事等,當(dāng)它有了存在感,事情就不同了。
Avatar Framework工具可以創(chuàng)造出可以模擬無法觸及的人,微軟小冰內(nèi)部有沒有做到呢?
李笛稱,內(nèi)部確實(shí)在做,但如果做到了,將是真的非常完美的狀態(tài),一定會(huì)公布?,F(xiàn)在Avatar Framework應(yīng)該可以理解為第一代Avatar Framework,主要?dú)v史使命是第一次開始把工具開放出來,這樣第三方可以通過工具去操作該框架,而不是像過去一樣只有小冰的團(tuán)隊(duì)在做自己小冰的AI being,工具后面還會(huì)不停地再去迭代,甚至一部分會(huì)開源出來,這都是未來計(jì)劃的一部分,最終會(huì)形成越來越強(qiáng)大的工具,現(xiàn)在只是開始,而不是結(jié)束。
本次Avatar Framework工具包首先面向全部合作伙伴及客戶發(fā)布。面向個(gè)人使用者的版本預(yù)計(jì)將于2020年春季發(fā)布。
對(duì)于Avatar Framework工具包的可用性和易用性方面,李笛進(jìn)一步表示,Avatar Framework框架本身就是存在的,而這次發(fā)布的是Avatar Framework工具包,用來操作Avatar Framework,所以先做可用性,再做易用性。經(jīng)歷小冰內(nèi)測(cè)使用——合作伙伴使用——個(gè)人版使用的過程。因?yàn)閭€(gè)人版最需要易用性,目前還在繼續(xù)在易用性方面攻堅(jiān),希望它是一個(gè)絕大部分人都能去使用的,而不是只有少部分人才能使用的產(chǎn)品。
通過該方式去操作一個(gè)完整的AI being并不一定是最好的選擇另外小冰團(tuán)隊(duì)也在考慮是否先孤立出一些相應(yīng)產(chǎn)品提供給個(gè)人使用,但原來的框架能力已經(jīng)存在,現(xiàn)在要做的是工具,是操作界面。
發(fā)展趨勢(shì)是不要做成專業(yè)工具,而是面向那些現(xiàn)在并沒有成為專業(yè)軟件使用者的更廣泛的人群。
▲微軟小冰,上面展現(xiàn)的只是冰山一角,下面是雄厚的技術(shù)儲(chǔ)備
在基于小冰001號(hào)未來的技術(shù)突破方向話題上,小冰團(tuán)隊(duì)總負(fù)責(zé)人李笛認(rèn)為,其技術(shù)突破方向一直都沒有停,唯一沒有變的是技術(shù)框架,雖然該框架這些年都沒有變,但是在框架的每一個(gè)部分都在不停地進(jìn)行技術(shù)的迭代演進(jìn)。所以更加容易預(yù)測(cè)地到接下來迭代的技術(shù)內(nèi)容。
比如,框架中基于情感計(jì)算的核心對(duì)話部分,先是從檢索模型迭代到生成模型,然后迭代到共感模型,共感模型一開始是引導(dǎo)對(duì)話,現(xiàn)在開始做主導(dǎo)對(duì)話,這個(gè)迭代還會(huì)不斷地再往下走。
然后像感官,小冰一代的時(shí)候只有文本,后來開始有文本圖像、語音,后來又加上短視頻、視頻,這些都還是一輪一輪交互,可以理解為半雙工交互,然后開始出現(xiàn)全雙工的語音、實(shí)時(shí)視覺,現(xiàn)在又把它合并在一起做多模態(tài)的感官,還在不停地在迭代。
像內(nèi)容方面,小冰一開始是知識(shí)圖譜,后來有內(nèi)容引導(dǎo),開始做自己的內(nèi)容,就是通過人工智能創(chuàng)造的方式去生產(chǎn)內(nèi)容,一直這么迭代。
在可見的未來,小冰團(tuán)隊(duì)總負(fù)責(zé)人李笛認(rèn)為該框架目前看來還是比較完整的,所以新的技術(shù)演進(jìn)方式還是基于該框架內(nèi)。