近日,騰訊優(yōu)圖實(shí)驗(yàn)室在CVPR2021舉辦的Image Matching Workshop(IMW2021)比賽中,提出的圖像匹配技術(shù) (SS-Fusing)榮獲雙賽道冠亞軍。IMW2021是Google和University of British Columbia(UBC)聯(lián)合舉辦的Workshop比賽,吸引了包括曠視,商湯,EPFL,KORNIA,華中科大和OPPO等公司、學(xué)校和機(jī)構(gòu)參加。

作為計(jì)算機(jī)視覺領(lǐng)域的基礎(chǔ)技術(shù)之一,Image Matching是指尋找一張圖片中拍攝的子區(qū)域在另一張圖片中的對應(yīng)位置,廣泛應(yīng)用于包括SFM、SLAM、三維重建、大規(guī)模圖像檢索,缺陷檢測與配準(zhǔn)等領(lǐng)域。

圖1、圖像匹配技術(shù)示例
本次比賽的評測機(jī)制如圖2所示,參賽者根據(jù)自己提出的方法提取每張圖的關(guān)鍵點(diǎn)和對應(yīng)描述子,并提交每兩張圖之間的匹配結(jié)果,賽方會根據(jù)提交的結(jié)果統(tǒng)計(jì)兩種評估方案:1.通過對比兩張圖之間匹配結(jié)果對應(yīng)的相機(jī)位姿和真實(shí)位姿之間的差異(Stereo)。2.根據(jù)多張圖之間的關(guān)鍵點(diǎn)匹配結(jié)果,統(tǒng)計(jì)重建后預(yù)測全圖的相機(jī)位姿和真實(shí)位姿之間的差異(Multi-view)。因此對于任意兩張圖之間,關(guān)鍵點(diǎn)的分布越分散,匹配的點(diǎn)越準(zhǔn),則位姿估計(jì)的效果越好。

圖2、比賽流程圖
此外,本屆比賽分為限制性賽道(Restricted category)和非限制性賽道(Unlimited category),其中限制性賽道要求參賽者提交有限的關(guān)鍵點(diǎn)和對應(yīng)描述子,非限制性賽道可提交不限數(shù)量的關(guān)鍵點(diǎn)對和對應(yīng)描述子。相較于前兩屆比賽,本屆比賽增加了街景和公園等場景,圖片之間的角度和尺度變換更大,對算法挑戰(zhàn)非常大,因此我們同時(shí)針對關(guān)鍵點(diǎn)的提取部分和匹配準(zhǔn)確度部分都做了相應(yīng)的改善,具體思路如下:
我們使用SuperPoint+Autoencoder+SuperGlue作為我們的關(guān)鍵點(diǎn)匹配pipeline。其中SuperPoint用于提取關(guān)鍵點(diǎn)和對應(yīng)描述子,Autoencoder用于特征壓縮,SuperGlue用于關(guān)鍵點(diǎn)匹配,最后通過DEGENSAC進(jìn)行離群點(diǎn)過濾。同時(shí)我們優(yōu)化了SuperGlue的訓(xùn)練過程和損失函數(shù),提升了模型在比賽數(shù)據(jù)集下的匹配精度。

圖3、SS-Fusing算法流程圖
我們針對輸入圖片進(jìn)行隨機(jī)變換增加了提取到的關(guān)鍵點(diǎn)對尺度變換的魯棒性,同時(shí)提出了針對描述子的特征融合模塊,以提升描述子的表達(dá)能力和尺度魯棒性。同時(shí)我們還對比了我們的特征融合和平均特征融合的效果,其中橫坐標(biāo)為描述子的cos相似度,縱坐標(biāo)為二者的分布差異,可見我們的方法在高相似度區(qū)域下的占比明顯高于平均特征,而在低相似度區(qū)域下的占比明顯低于平均特征,驗(yàn)證了我們方法的有效性。

圖4、特征融合模塊

圖5、加權(quán)特征和平均特征相似度分布差異圖
我們提出了前背景分割和coarse-to-fine的匹配結(jié)構(gòu),進(jìn)一步提升關(guān)鍵點(diǎn)匹配的有效性。其中前背景分割可以有效過濾掉與匹配無關(guān)的背景部分。Coarse-to-fine的匹配結(jié)構(gòu)可以提升拍攝尺度差異過大導(dǎo)致的匹配率過低的問題。

圖6、前背景分離示意圖

圖7、coarse-to-fine匹配前后示意圖
視覺圖像匹配作為基礎(chǔ)的計(jì)算機(jī)視覺能力,在其基礎(chǔ)上可拓展眾多的下游任務(wù)。如在圖像檢索中,可以通過image matching來檢索到和Database中相似的圖片,如圖8所示。在SFM(Structure from motion)中,可以通過關(guān)鍵點(diǎn)匹配來獲取攝像頭外參并結(jié)合內(nèi)參進(jìn)行深度估計(jì)并重建出拍攝物體(如圖9所示)。在圖像跟蹤與配準(zhǔn)中,通過前后幀的匹配可以捕捉視頻的運(yùn)動軌跡,并針對目標(biāo)物體進(jìn)行視頻跟蹤與圖像配準(zhǔn)。

圖8、圖像檢索

圖9、三維重建
作為騰訊旗下頂尖的人工智能實(shí)驗(yàn)室,優(yōu)圖實(shí)驗(yàn)室聚焦計(jì)算機(jī)視覺,專注人臉識別、圖像識別、OCR等領(lǐng)域開展技術(shù)研發(fā)和行業(yè)落地,在推動產(chǎn)業(yè)數(shù)字化升級過程中,始終堅(jiān)持基礎(chǔ)研究、產(chǎn)業(yè)落地兩條腿走路的發(fā)展戰(zhàn)略,與騰訊云與智慧產(chǎn)業(yè)深度融合,挖掘客戶痛點(diǎn),切實(shí)為行業(yè)降本增效。
未來,騰訊優(yōu)圖實(shí)驗(yàn)室也將繼續(xù)深耕CV技術(shù),并將持續(xù)探索更多的應(yīng)用場景和應(yīng)用空間,讓更多的用戶享受到科技帶來的紅利。
特別提醒:本網(wǎng)信息來自于互聯(lián)網(wǎng),目的在于傳遞更多信息,并不代表本網(wǎng)贊同其觀點(diǎn)。其原創(chuàng)性以及文中陳述文字和內(nèi)容未經(jīng)本站證實(shí),對本文以及其中全部或者部分內(nèi)容、文字的真實(shí)性、完整性、及時(shí)性本站不作任何保證或承諾,并請自行核實(shí)相關(guān)內(nèi)容。本站不承擔(dān)此類作品侵權(quán)行為的直接責(zé)任及連帶責(zé)任。如若本網(wǎng)有任何內(nèi)容侵犯您的權(quán)益,請及時(shí)聯(lián)系我們,本站將會在24小時(shí)內(nèi)處理完畢。
相關(guān)推薦
- 海外廣告聯(lián)盟評測:日付平臺與CPV模式如何高效變現(xiàn)?
- RAKsmart防護(hù)配置實(shí)戰(zhàn):10Gbps套餐部署指南
- 華納云香港高防服務(wù)器150G防御4.6折促銷,低至6888元/月,CN2大帶寬直連清洗,終身循環(huán)折扣
- 2025年國內(nèi)免費(fèi)AI工具推薦:文章生成與圖像創(chuàng)作全攻略
- 站長必讀:從“流量思維”到“IP思維”的品牌升級之路
- 從流量變現(xiàn)到信任變現(xiàn):個人站長的私域運(yùn)營方法論
- 傳統(tǒng)網(wǎng)站如何借力短視頻?從SEO到“內(nèi)容種草”的轉(zhuǎn)型策略
- AI時(shí)代,個人站長如何用AI工具實(shí)現(xiàn)“一人公司”