
阿里圖像搜索之父
12月22日消息,近日,美國計算機協(xié)會(ACM)公布了2015年度杰出科學家名單,在上榜的兩位亞裔學者中,阿里巴巴圖像搜索的領軍人物、阿里巴巴搜索事業(yè)部研究員華先勝位列其中。
與此同時,國際電氣與電子工程師協(xié)會(IEEE)也公布了華先勝當選2016年度IEEE Fellow(IEEE會士)的消息,以嘉獎其“為多媒體內(nèi)容分析和圖像搜索做出的突出貢獻”。
與通用搜索主要依靠字節(jié)不同,圖像搜索被主要定義為“以圖搜圖”。據(jù)華先勝介紹,圖像搜索的第一步是訓練計算機進行圖像理解,也就是通過計算機將圖片中的要素,包括人像、顏色、紋理等具體特征以及深度學習產(chǎn)生的圖像描述,轉(zhuǎn)化為類似文字的“視覺詞”,編成索引之后,才能再進行第二步——圖像搜索。
從20世紀90年代開始,國際上就開始了對圖像搜索的研究,但直到2008年前后,計算機開始能夠處理大量圖像,圖像搜索技術(shù)才得以突飛猛進的發(fā)展。
2008年,還在微軟亞洲研究院工作的華先勝,就因在圖像和視頻搜索方面的嘗試,獲得了由《麻省理工學院技術(shù)評論》頒發(fā)的“全球35位35歲以下的杰出青年創(chuàng)新人物(MIT TR35)獎”。
評委會在頒獎詞中寫道:“有效的基于內(nèi)容的視頻搜索仍然還有很多困難沒有解決。而華先勝希望通過自動識別圖像和視頻中物體、場景、事件和其他語義特征來攻克這個壁壘。”?
從“智能”到“更智能”
華先勝另一項為業(yè)界矚目的成績,就是設計并實現(xiàn)了不需要“人工標注訓練數(shù)據(jù)”就能產(chǎn)生識別任意目標的圖像識別系統(tǒng)。
“之前,圖像識別需要要人工去給圖像貼標簽(Label),讓計算機從這些數(shù)據(jù)中學習出識別模型,但我們提升了一步,訓練計算機自己去找數(shù)據(jù),建立自動識別的模型。比如要識別和搜索不同種類的花卉,不用標注900多種花卉的圖片,而是直接輸入花卉的名稱列表,計算機就可以自行去網(wǎng)上找數(shù)據(jù)、進行清洗、補充、學習,然后就能進行圖像識別了。”
華先勝介紹,這一技術(shù)可以適用于多種場景的圖像搜索,比如明星臉識別,不用輸入“范冰冰”的照片,計算機可以從網(wǎng)上自動學習辨認。
隨著近年來深度學習技術(shù)在圖像分析和識別領域的廣泛應用,圖像的描述(特征)有了非常大的進步,而阿里的大量商品圖像數(shù)據(jù)和用戶數(shù)據(jù),包括用戶使用反饋數(shù)據(jù)的挖掘和回流,也使得電商平臺搜索結(jié)果的相關性不斷提升,“拍立淘”的用戶UV在過去半年內(nèi)猛增了兩倍多。
90后占“拍立淘“用戶一半以上
根據(jù)手淘數(shù)據(jù)顯示,在“拍立淘”用戶中,90后占比高達55.1%,遠高于無線搜索的該年齡段整體用戶占比——年輕人顯然更中意“以圖搜圖”這種看上去很“潮”的搜索方式。
實際上,拍立淘未來還有很多種玩法:比如,拍件衣服,拍立淘可以推薦與之搭配的服飾;輸入家具的照片,拍立淘可以配套其它家具及家飾;包括AR(虛擬現(xiàn)實)方式,拍立淘可以實時展現(xiàn)攝像頭前物品對應的商品及信息……
除了拍立淘,華先勝還舉了這樣一個運用到圖像搜索技術(shù)的例子:淘寶店鋪中的很多“大碼”服裝,由很骨感的模特試穿,這樣很可能會影響到用戶的試穿體驗,但阿里搜索的圖像識別系統(tǒng),目前就能把”微胖“的模特作展示的店鋪排在前面,讓商品信息對消費者更有參考價值。
“圖像搜索就像電商中的水電煤,有的產(chǎn)品,像‘拍立淘’是可以被用戶感知的,有些技術(shù)演進則是藏在應用和服務背后,默默為大家服務。”
華先勝介紹說,其實電商平臺上處處都有圖像技術(shù)的需求,從商品圖片的分析理解、商品識別、商品屬性識別、場景識別,到人臉檢測(試妝)、人臉屬性(年齡、性別、顏值等)、人臉識別(如明星識別)、人臉合成(試衣)等,甚至視頻分割、事件檢測、物品檢測跟蹤、廣告投放等,都離不開圖片技術(shù)。可以說,圖像技術(shù)正被應用于商品推薦、個性化、商品管理以及其他搜索的方方面面。
對于“拍立淘”的未來,華先勝表示,拍立淘將會拓展到更多領域,力爭成為人們獲取信息(包括購物、教育、娛樂、新聞、知識等等)的一個快捷、有趣、有效的入口,而不僅僅是搜尋商品的入口。“希望在未來,通過拍照或者相機鏡頭掃描動作會成為人們獲取信息的一種習慣。”
特別提醒:本網(wǎng)內(nèi)容轉(zhuǎn)載自其他媒體,目的在于傳遞更多信息,并不代表本網(wǎng)贊同其觀點。其原創(chuàng)性以及文中陳述文字和內(nèi)容未經(jīng)本站證實,對本文以及其中全部或者部分內(nèi)容、文字的真實性、完整性、及時性本站不作任何保證或承諾,并請自行核實相關內(nèi)容。本站不承擔此類作品侵權(quán)行為的直接責任及連帶責任。如若本網(wǎng)有任何內(nèi)容侵犯您的權(quán)益,請及時聯(lián)系我們,本站將會在24小時內(nèi)處理完畢。