
10月24日上午消息,據(jù)中國(guó)臺(tái)灣地區(qū)媒體iThome.com.tw報(bào)道,Google在2018 ACM多媒體會(huì)議上,推出一種使用機(jī)器學(xué)習(xí)來(lái)標(biāo)注圖片界面,讓使用者快速為圖片中物體標(biāo)記出輪廓以及標(biāo)簽,提高整體標(biāo)記速度達(dá)三倍。
由于現(xiàn)代基于深度學(xué)習(xí)電腦視覺模型的性能,取決標(biāo)簽訓(xùn)練資料的多少,越大的資料庫(kù)將能讓機(jī)器學(xué)習(xí)有更好的表現(xiàn)。Google在許多深度學(xué)習(xí)的研究都一再提到,高品質(zhì)的訓(xùn)練資料取得并不容易,而這個(gè)問題已經(jīng)成為發(fā)展電腦視覺的主要瓶頸,對(duì)于諸如自動(dòng)駕駛、機(jī)器人或是圖片搜尋等這類以像素為辨識(shí)基礎(chǔ)的工作更是如此。
傳統(tǒng)的方法需要使用者手動(dòng)以標(biāo)記工具,圈出圖片中物體的邊界,Google提到,使用COCO加Stuff資料集,標(biāo)記一個(gè)圖片需要19分鐘,標(biāo)記完整個(gè)資料集需要53000個(gè)小時(shí),太過耗時(shí)沒效率。因此Google探索了全新的訓(xùn)練資料標(biāo)記方法-流體標(biāo)注(Fluid Annotation),能以機(jī)器學(xué)習(xí)幫助使用者快速找出圖片物體輪廓上標(biāo)簽。
流體標(biāo)注從強(qiáng)語(yǔ)義分割模型的輸出開始,使用者能以自然的使用者界面,借由機(jī)器學(xué)習(xí)輔助進(jìn)行編輯和修改,界面提供使用者需要修正的物體以及順序,讓人們能夠?qū)P挠谀切C(jī)器尚無(wú)法辨識(shí)清楚的部分。為了標(biāo)注圖片,Google預(yù)先以約一千張具有分類標(biāo)簽和信任分?jǐn)?shù)的圖片訓(xùn)練了語(yǔ)意分割模型(Mask-RCNN),具有最高信心的片段(Segment)能被用于初始標(biāo)簽中。
流體標(biāo)注能夠?yàn)槭褂谜弋a(chǎn)生一個(gè)短清單,透過點(diǎn)擊就能快速為物體上標(biāo)簽,而使用者也可以增加范圍標(biāo)記,來(lái)覆蓋沒被偵測(cè)出來(lái)的物體,并透過滾動(dòng)選擇最佳的形狀。另外,除了能夠增加,也能刪除既有的物體標(biāo)記或是變更物體深度順序。
目前這一階段的流體標(biāo)注的目標(biāo)是讓圖像更快更容易,提高整體資料集標(biāo)記速度達(dá)三倍。接下來(lái)Google要改進(jìn)物體邊界標(biāo)記,并以更多的人工智能加速界面操作,擴(kuò)展界面以處理現(xiàn)在無(wú)法辨識(shí)的類別。
特別提醒:本網(wǎng)內(nèi)容轉(zhuǎn)載自其他媒體,目的在于傳遞更多信息,并不代表本網(wǎng)贊同其觀點(diǎn)。其原創(chuàng)性以及文中陳述文字和內(nèi)容未經(jīng)本站證實(shí),對(duì)本文以及其中全部或者部分內(nèi)容、文字的真實(shí)性、完整性、及時(shí)性本站不作任何保證或承諾,并請(qǐng)自行核實(shí)相關(guān)內(nèi)容。本站不承擔(dān)此類作品侵權(quán)行為的直接責(zé)任及連帶責(zé)任。如若本網(wǎng)有任何內(nèi)容侵犯您的權(quán)益,請(qǐng)及時(shí)聯(lián)系我們,本站將會(huì)在24小時(shí)內(nèi)處理完畢。
相關(guān)推薦
- 海外廣告聯(lián)盟評(píng)測(cè):日付平臺(tái)與CPV模式如何高效變現(xiàn)?
- RAKsmart防護(hù)配置實(shí)戰(zhàn):10Gbps套餐部署指南
- 自媒體推廣實(shí)時(shí)監(jiān)控從服務(wù)器帶寬到用戶行為解決方法
- 傳統(tǒng)網(wǎng)站如何借力短視頻?從SEO到“內(nèi)容種草”的轉(zhuǎn)型策略
- AI時(shí)代,個(gè)人站長(zhǎng)如何用AI工具實(shí)現(xiàn)“一人公司”
- 服務(wù)器的系統(tǒng)和普通電腦系統(tǒng)一樣嗎?
- 選擇站群VPS時(shí)必須關(guān)注的六大核心需求
- 如何利用RAKsmart多IP服務(wù)器規(guī)避SEO地域限制