10月22日,在2016英特爾中國行業(yè)峰會的“互聯(lián)網(wǎng)高峰論壇”上,搜狗公司首席架構(gòu)師周天凌發(fā)表了“智能時代的搜狗企業(yè)搜索”主題演講,面向參會的數(shù)百家企業(yè)首次深入介紹了搜狗企業(yè)搜索業(yè)務(wù)及優(yōu)勢,受到了與會者的關(guān)注并引發(fā)了現(xiàn)場熱烈討論。

(搜狗首席架構(gòu)師周天凌演講現(xiàn)場照片)
搜狗搜索是中國第二大搜索引擎,從2004年上線至今已經(jīng)超過12年,用戶數(shù)高達(dá)5.6億,覆蓋中國95%的互聯(lián)網(wǎng)用戶。搜狗企業(yè)搜索則是其近期推出的面向企業(yè)級客戶的新業(yè)務(wù),在自身追求技術(shù)創(chuàng)新突破的同時,搜狗搜索把搜索引擎組件化、平臺化、服務(wù)化,形成了對各個網(wǎng)站的搜索開放能力,致力于為社會機(jī)構(gòu)、企業(yè)及組織提供先進(jìn)的搜索技術(shù)支持與服務(wù),以期為更多合作伙伴的直接用戶帶來站內(nèi)搜索體驗(yàn)的升級。
論壇上,搜狗首席架構(gòu)師周天凌表示,搜狗企業(yè)搜索將12年來搜狗搜索在To C領(lǐng)域所積累的成熟領(lǐng)先的技術(shù)進(jìn)行輸出,應(yīng)用最先進(jìn)的大數(shù)據(jù)挖掘、自然語言處理、機(jī)器學(xué)習(xí)排序,以及最前沿的基于深度學(xué)習(xí)的語義計算等智慧搜索技術(shù),幫助企業(yè)更好地讀懂用戶查詢背后真正的需求,并給用戶提供更精準(zhǔn)的搜索結(jié)果,帶來搜索體驗(yàn)升級。

(搜狗企業(yè)搜索展臺吸引了國內(nèi)外行業(yè)用戶駐足)
針對企業(yè)搜索目前面臨的各種問題,搜狗企業(yè)搜索在為網(wǎng)站提供專屬搜索服務(wù)上優(yōu)勢明顯,主要可以總結(jié)為幾個方面。
搜索結(jié)果的實(shí)時性、全面性
對于新發(fā)現(xiàn)的頁面,會實(shí)時進(jìn)行頁面分析、建立索引并被用戶檢索到。頁面從發(fā)現(xiàn)到被檢索延遲在分鐘級內(nèi),一般重要頁面可以做到秒級延遲。根據(jù)具體情況,網(wǎng)站也可以將新增網(wǎng)頁實(shí)時推送至站內(nèi)搜索系統(tǒng),進(jìn)而建立索引并被檢索,采用實(shí)時推送模式,頁面從產(chǎn)生到被檢索到的延遲可以控制在秒級內(nèi)。
在對查詢意圖進(jìn)行深入理解的基礎(chǔ)上給出精準(zhǔn)結(jié)果
搜索系統(tǒng)會對用戶查詢進(jìn)行多維度分析,包括查詢糾錯、實(shí)體識別、同義詞擴(kuò)展以及查詢意圖識別等,并根據(jù)查詢詞權(quán)重進(jìn)行查詢改寫,以保證召回符合需求的文檔。進(jìn)而會對召回的文檔進(jìn)行與查詢的匹配計算,在計算時會融合多維度特征,包括頁面特征、文本相關(guān)性、查詢時效性、頁面權(quán)威度、用戶行為特征等進(jìn)行深度學(xué)習(xí)排序,將最滿足用戶需求的文檔排在前面。
系統(tǒng)具有高可用性和穩(wěn)定性
搜狗企業(yè)搜索系統(tǒng)繼承了搜狗搜索的高性能與高穩(wěn)定性,在單節(jié)點(diǎn)千萬級網(wǎng)頁量情況下,用戶平均查詢時間在100ms左右。搜狗搜索系統(tǒng)經(jīng)過了長時間、大數(shù)據(jù)量以及高壓力的考驗(yàn),對各種異常情況進(jìn)行了完善處理,其系統(tǒng)穩(wěn)定性在99.99%+。
系統(tǒng)對接方便,簡單易用
使用搜狗企業(yè)搜索系統(tǒng),企業(yè)只需要提供網(wǎng)站數(shù)據(jù)以及進(jìn)行結(jié)果展現(xiàn)。在數(shù)據(jù)提供上,用戶可以選擇數(shù)據(jù)推送和spider抓取兩種方式。另外,搜狗企業(yè)搜索提供了豐富的結(jié)果展現(xiàn)樣式,企業(yè)只需簡單調(diào)配顏色、添加網(wǎng)站Logo即可使用。
在提供基本搜索服務(wù)同時,搜狗企業(yè)搜索系統(tǒng)還提供了完善的監(jiān)控與運(yùn)營數(shù)據(jù)查詢功能。通過監(jiān)控及統(tǒng)計系統(tǒng),可以查詢檢索量、索引量、檢索耗時、熱搜詞等,及時掌握應(yīng)用的運(yùn)營情況,同時提供完善的監(jiān)控報警及故障應(yīng)急機(jī)制,保證應(yīng)用的正常運(yùn)行。
周天凌向與會者說明了搜狗企業(yè)搜索的發(fā)展歷程,并結(jié)合2016年4月搜狗企業(yè)搜索為清華校園搜索系統(tǒng)(http://search.tsinghua.edu.cn/)提供整套校園搜索服務(wù)的案例,對搜狗搜索成熟的校園搜索解決方案進(jìn)行了展示。通過對清華校園網(wǎng)搜索日志進(jìn)行分析,搜狗企業(yè)搜索總結(jié)出用戶檢索需求主要分為導(dǎo)航類、信息公告類查詢、人物類查詢幾種,并針對這幾種查詢需求演示了具體的解決方案。
例如,對于查詢詞“美院”,搜狗企業(yè)搜索引擎對其進(jìn)行查詢分析,將其擴(kuò)展為“美術(shù)學(xué)院”,同時對官網(wǎng)頁面及時效性頁面進(jìn)行分析并與查詢詞進(jìn)行匹配計算,最終返回用戶所需要的文檔,效果如下圖所示。
信息公告類查詢是學(xué)校師生需求比較強(qiáng)的一類查詢,從檢索日志中可以看出,有大量的查詢公告的請求,比如“暑期夏令營”、“暑期社會實(shí)踐”、“畢業(yè)離校通知”等。搜狗提供的站內(nèi)搜索系統(tǒng)可以做到將頁面秒級內(nèi)建立索引并被檢索,保證結(jié)果的時效性。此外,為了能夠讓用戶更好檢索到最新信息,搜狗提供的站內(nèi)搜索引擎在顯著位置設(shè)置了時間篩選功能,比如查詢“領(lǐng)軍計劃初試結(jié)果”,可以進(jìn)行“一天內(nèi)”或者“一周內(nèi)”等篩選,以便更精準(zhǔn)獲取所需結(jié)果。

(清華大學(xué)官網(wǎng)搜索結(jié)果截圖)
除了搜狗企業(yè)搜索本身的優(yōu)勢介紹之外,周天凌還提及了搜狗在技術(shù)研發(fā)方面的實(shí)力背書,據(jù)悉,2015年搜狗的2400余名員工中,研發(fā)人員所占比例高達(dá)76%,中國所有互聯(lián)網(wǎng)公司中排名最高;技術(shù)專利排名行業(yè)第3,僅次于騰訊、百度。
現(xiàn)今,越來越多的網(wǎng)站對于搜索功能有更高的需求,而真正實(shí)用的搜索功能不只是查詢詞的精確匹配,還需要對用戶的查詢以及要檢索的文檔進(jìn)行理解,并進(jìn)行多維度的相關(guān)性計算,找出真正滿足用戶需求的文檔,而這涉及到了計算機(jī)科學(xué)與技術(shù)領(lǐng)域最前沿、最復(fù)雜的技術(shù)。搜狗搜索具有強(qiáng)大的技術(shù)團(tuán)隊(duì)以及技術(shù)積累,并且具有成熟的技術(shù)輸出經(jīng)驗(yàn),有能力并且有意愿為社會機(jī)構(gòu)、企業(yè)及組織提供先進(jìn)的搜索技術(shù)支持與服務(wù),為更多合作伙伴的直接用戶帶來站內(nèi)搜索體驗(yàn)的升級。
特別提醒:本網(wǎng)信息來自于互聯(lián)網(wǎng),目的在于傳遞更多信息,并不代表本網(wǎng)贊同其觀點(diǎn)。其原創(chuàng)性以及文中陳述文字和內(nèi)容未經(jīng)本站證實(shí),對本文以及其中全部或者部分內(nèi)容、文字的真實(shí)性、完整性、及時性本站不作任何保證或承諾,并請自行核實(shí)相關(guān)內(nèi)容。本站不承擔(dān)此類作品侵權(quán)行為的直接責(zé)任及連帶責(zé)任。如若本網(wǎng)有任何內(nèi)容侵犯您的權(quán)益,請及時聯(lián)系我們,本站將會在24小時內(nèi)處理完畢。