近日,科大訊飛憑借在道路目標檢測領域多年的技術探索,刷新了Cityscapes 3D目標檢測任務的全球最好成績,得到檢測分數(shù)(DS)42.9,取得了該項評測的第一名。這也是,科大訊飛繼2017年、2018年參與測評之后,再一次刷新Cityscapes的世界紀錄。

此次評測,科大訊飛借鑒了已在城市交通出行場景下應用的Anchor-Free車輛檢測技術,將2D目標檢測技術升級至3D,并結合3D到2D重投影的特殊先驗信息進行算法遷移,通過結合語義、上下文信息、位置先驗信息以及目標形狀先驗信息等,提取精確的3D目標檢測框,構建形成一套具有豐富上下文信息的多層次單目3D目標檢測方案
什么是Cityscapes和3D目標檢測任務?
我們知道,在深度學習圖像語意分割的訓練過程中,需要有數(shù)據(jù)集及分好類的標簽,這樣才可以讓你的神經(jīng)網(wǎng)絡進行學習,進而訓練出模型。Cityscapes便是包含城市大量街道圖片、視頻用來訓練識別的數(shù)據(jù)集,由戴姆勒(DAIMLER)等在內的三家德國單位聯(lián)合提供,吸引了華為、阿里、微軟、北大、中科院、MIT等上百個國內外著名AI實驗室和頂尖學術研究機構積極參與,是CVPR、ECCV等國際頂級會議中實例分割任務常用的權威測試數(shù)據(jù)集。
2020年,在CVPR workshop上,Cityscapes公開了新的單目圖像3D目標檢測評測集,包含car, truck, bus, train, bicycle, motorcycle共6種類別目標。每種目標需要檢測出其在空間中的三維坐標位置,目標的長、寬、高以及目標在空間中的旋轉姿態(tài)。基于視覺的3D目標檢測,是圖像處理和計算機視覺領域的重要研究方向之一。

基于視覺的3D目標檢測有什么重要意義?
基于科大訊飛在AI+3D視覺技術的結合探索之下,未來3D目標檢測將能在城市治理、工業(yè)智能、機器智能、智能駕駛等多方面發(fā)揮廣泛的作用。
【提供參考】
通過三維目標檢測技術,可以感知目標的三維尺寸信息、空間位置。
【精準判斷】
通過空間位置感知,可以更精準地判斷目標和參照物之間的位置關系。
比如在城市交通管理場景中,當前交通違法判定主要還是依靠固定攝像頭抓拍、二維圖像判定的方式,往往存在視覺盲區(qū)。若將3D目標檢測技術接入公安交警現(xiàn)有的交通視頻智能分析平臺,與AI巡檢相結合,可以進一步精確判定車輛車型,基于空間位置感知和連續(xù)軌跡跟蹤,計算出車輛的行駛速度、空間軌跡等,為越斑馬線停車、超速抓拍、擁堵感知等違法異常事件判斷提供更實時、更精準的決策依據(jù)。這不僅能夠達到對已有設備資源的最大化利用,實現(xiàn)降本提效,還能夠提升城市數(shù)字化治理能力,助力文明出行、平安出行。
如下圖所示,右側黑色車輛2D檢測外邊框和右側交通線相交,此時通過二維平面相交關系判斷,會認定車輛壓線行駛。但從三維的檢測結果分析,能夠判斷出車體并沒有越過交通線。

AI賦能,建設美好世界
如何讓機器變得更加“聰明”,具備足夠的學習能力,并更精準地貼合現(xiàn)實使用需求,是所有人工智能研發(fā)團隊所需解決的最大難題??拼笥嶏w直面檢測精細度更高、場景更為復雜、挑戰(zhàn)難度更大的3D目標檢測任務,并一舉刷新了世界紀錄,意味著科大訊飛已經(jīng)具備了強大的AI技術硬核實力。
多年來,科大訊飛在人工智能領域百花齊放,在基于深度學習的通用核心技術上厚積薄發(fā)。不僅在智能語音、機器翻譯等大眾熟悉的領域上在多項國際權威賽事上取得第一,實際上,科大訊飛在教育圖文、人臉識別等計算機視覺領域也深耕多年,擁有豐富的經(jīng)驗和國際領先的技術,并已運用在教育、醫(yī)療、金融等多個行業(yè),取得耀眼成績,獲得良好口碑。
未來,科大訊飛將繼續(xù)堅持源頭技術創(chuàng)新路線,秉持“頂天立地”的理念,加快開放應用場景,促進AI技術和各種應用場景相結合,加速人工智能技術落地,建設美好世界。(通訊員:科大訊飛集團 李倩)
特別提醒:本網(wǎng)信息來自于互聯(lián)網(wǎng),目的在于傳遞更多信息,并不代表本網(wǎng)贊同其觀點。其原創(chuàng)性以及文中陳述文字和內容未經(jīng)本站證實,對本文以及其中全部或者部分內容、文字的真實性、完整性、及時性本站不作任何保證或承諾,并請自行核實相關內容。本站不承擔此類作品侵權行為的直接責任及連帶責任。如若本網(wǎng)有任何內容侵犯您的權益,請及時聯(lián)系我們,本站將會在24小時內處理完畢。