據(jù)外媒Venturebeat報(bào)道,F(xiàn)acebook、喬治亞理工學(xué)院和俄勒岡州立大學(xué)的研究人員在本周發(fā)表的一篇預(yù)印本論文中,描述了人工智能的一項(xiàng)新任務(wù)——通過聽自然語言的指令,在3D環(huán)境中導(dǎo)航(例如,“走下大廳,在木桌旁左轉(zhuǎn)”)。他們說,這可以為遵循自然語言指令的機(jī)器人助手奠定基礎(chǔ)。

研究人員的任務(wù),被稱之為在連續(xù)環(huán)境中的視覺和語言導(dǎo)航(VLN-CE),是在Facebook的模擬器Habitat中進(jìn)行的,該模擬器可以訓(xùn)練機(jī)器人助手在模擬真實(shí)環(huán)境的環(huán)境中操作。直徑為0.2米、1.5米高的助手被放置在來自Matterport3D數(shù)據(jù)集的內(nèi)部,該數(shù)據(jù)集是通過10800多個(gè)全景圖和相應(yīng)的3D網(wǎng)格捕獲的90個(gè)環(huán)境的集合。
機(jī)器人助手必須在一條路徑上做四個(gè)動作(向前移動0.25米,左轉(zhuǎn)或右轉(zhuǎn)15度,或停在目標(biāo)位置)中的一個(gè),并學(xué)會避免被困在障礙物上,比如椅子和桌子上。
研究小組將這些環(huán)境提煉成4475條由4到6個(gè)節(jié)點(diǎn)組成的軌跡,這些軌跡對應(yīng)于在各個(gè)位置拍攝的360度全景圖像,顯示了導(dǎo)航能力。
他們用這個(gè)訓(xùn)練兩個(gè)人工智能模型:一個(gè)sequence-to-sequence模型,該模型由采取視覺觀察和指令表示的策略組成,并使用它們預(yù)測一個(gè)動作;另一個(gè)是兩個(gè)網(wǎng)絡(luò)交叉模式注意模型,該模型跟蹤觀察結(jié)果,并根據(jù)指令和特征做出決策。

研究人員表示,在實(shí)驗(yàn)中,表現(xiàn)最好的機(jī)器人可以遵循“向左拐,進(jìn)入走廊”之類的指令,盡管這些指令要求機(jī)器人在發(fā)現(xiàn)視覺路標(biāo)之前轉(zhuǎn)動未知的次數(shù)。事實(shí)上,機(jī)器人在看不見的環(huán)境,大約三分之一的場景中導(dǎo)航到目標(biāo)位置,平均采取了88次行動。
這些機(jī)器人偶爾也會失敗,根據(jù)合著者的說法,這些失敗通常是由于機(jī)器人在視覺上丟失了指令中提到的對象。
“至關(guān)重要的是,VLN-CE為(研究)社區(qū)提供了一個(gè)測試平臺,在這里可以進(jìn)行研究高級和低級控制界面的這類集成實(shí)驗(yàn),”合著者寫道。
Facebook投入了大量資源來解決自主機(jī)器人導(dǎo)航的問題。
雷鋒網(wǎng)了解到,今年6月,在公布了一項(xiàng)訓(xùn)練六足機(jī)器人走路的計(jì)劃后,F(xiàn)acebook首次推出了PyRobot,一種用于PyTorch機(jī)器學(xué)習(xí)框架的機(jī)器人框架。2018年,F(xiàn)acebook推出了開源人工智能,可以通過360度圖像在紐約市街道上導(dǎo)航。最近,F(xiàn)acebook的一個(gè)團(tuán)隊(duì)發(fā)表了一篇論文,描述了一個(gè)通過觀看視頻學(xué)習(xí)如何在辦公室里走動的系統(tǒng)。
特別提醒:本網(wǎng)內(nèi)容轉(zhuǎn)載自其他媒體,目的在于傳遞更多信息,并不代表本網(wǎng)贊同其觀點(diǎn)。其原創(chuàng)性以及文中陳述文字和內(nèi)容未經(jīng)本站證實(shí),對本文以及其中全部或者部分內(nèi)容、文字的真實(shí)性、完整性、及時(shí)性本站不作任何保證或承諾,并請自行核實(shí)相關(guān)內(nèi)容。本站不承擔(dān)此類作品侵權(quán)行為的直接責(zé)任及連帶責(zé)任。如若本網(wǎng)有任何內(nèi)容侵犯您的權(quán)益,請及時(shí)聯(lián)系我們,本站將會在24小時(shí)內(nèi)處理完畢。
相關(guān)推薦
- 自媒體推廣實(shí)時(shí)監(jiān)控從服務(wù)器帶寬到用戶行為解決方法
- AI時(shí)代,個(gè)人站長如何用AI工具實(shí)現(xiàn)“一人公司”
- 選擇站群VPS時(shí)必須關(guān)注的六大核心需求
- 如何利用RAKsmart多IP服務(wù)器規(guī)避SEO地域限制
- 26億!普洛斯中國首支數(shù)據(jù)中心基金完成募集 AI驅(qū)動算力資產(chǎn)升溫
- 中信集團(tuán)在港成立人工智能科創(chuàng)中心 助力香港發(fā)展新質(zhì)生產(chǎn)力
- 匯聚產(chǎn)業(yè) 共話創(chuàng)新實(shí)踐丨IDCC2024算力技術(shù)創(chuàng)新與應(yīng)用系列論壇圓滿召開
- 采訪普洛斯數(shù)據(jù)中心郭仁聲:智算時(shí)代 我們需要怎樣的算力與數(shù)據(jù)中心