對于不少消費(fèi)者來說,客觀、獨(dú)立的消費(fèi)點(diǎn)評信息能夠幫助更準(zhǔn)確做決策。而對第三方點(diǎn)評平臺來說,如何保證點(diǎn)評信息的獨(dú)立、客觀其實(shí)挑戰(zhàn)很大。
記者了解到,在大眾點(diǎn)評內(nèi)部,有一支很少為外界所知的神秘部隊(duì)——誠信團(tuán)隊(duì),他們是點(diǎn)評世界的警察,完全獨(dú)立于業(yè)務(wù)團(tuán)隊(duì)之外,負(fù)責(zé)監(jiān)控和處理各種炒作、虛假點(diǎn)評。
面對造假手法和技術(shù)層出不窮的第三方炒作機(jī)構(gòu),這支部隊(duì)是如何與其戰(zhàn)斗,保證點(diǎn)評內(nèi)容的獨(dú)立、客觀的呢?帶著這種好奇,記者走進(jìn)了大眾點(diǎn)評誠信團(tuán)隊(duì)。
技術(shù)算法配合人工審查,確保準(zhǔn)確過濾
和現(xiàn)實(shí)世界里有警察與小偷一樣,點(diǎn)評誠信的世界里并不太平,時常存在著各種作弊與反作弊的斗爭,而誠信團(tuán)隊(duì)就好比點(diǎn)評世界里的警察,維護(hù)點(diǎn)評世界獨(dú)立、客觀的秩序。
在誠信團(tuán)隊(duì),記者見到誠信組員M君,她剛剛從滿屏的數(shù)據(jù)中抽身出來接受采訪,“審查處理各種虛假點(diǎn)評和炒作信息是我們非常重要的工作之一,每天需要從數(shù)以百萬計(jì)的點(diǎn)評中甄別出這些虛假信息,而對數(shù)據(jù)進(jìn)行分析是其中的一種方法”。M君表示,“每天至少需要看幾百份數(shù)據(jù)報(bào)表”,除此之外,她每天上班需要做的工作還包括瀏覽系統(tǒng)的反饋信息、處理客戶投訴、關(guān)注站務(wù)論壇等等,而這些僅僅是發(fā)現(xiàn)問題的方式。
當(dāng)問及是否需要人工一個個甄別時,M君笑道:“當(dāng)然不可能,大眾點(diǎn)評有一套完善的誠信系統(tǒng),主要通過技術(shù)算法來過濾虛假點(diǎn)評,人工審查只是輔助,如果有異常數(shù)據(jù)出現(xiàn)的話,系統(tǒng)會自動報(bào)警。”目前90%的虛假信息系統(tǒng)都會自動處理,而剩下的10%則需要M君和他的小伙伴們進(jìn)行人工審查。“信息的甄別是一份細(xì)致而繁重的工作,有時候?yàn)榱苏页隹赡艽嬖诘奶摷傩畔?,我們還會給自己設(shè)定角色,從虛假信息發(fā)布方自我假設(shè)來揣摸預(yù)測。”M君還特別強(qiáng)調(diào),誠信系統(tǒng)最大的挑戰(zhàn)在于既要保證抓得全、抓得及時,盡量減少漏抓,還必須保證沒有錯抓,所有的工作都是為了確保過濾的準(zhǔn)確性。
每周上線新算法打擊炒作點(diǎn)評
在M君看來,誠信組的工作其實(shí)是個大循環(huán),即:發(fā)現(xiàn)問題——數(shù)據(jù)分析——提煉特征——設(shè)計(jì)算法——實(shí)現(xiàn)算法——驗(yàn)證上線優(yōu)化系統(tǒng)——多方收集反饋發(fā)現(xiàn)問題。而所有人的工作都圍繞著這些在不斷的分解和前進(jìn)。
如果說把前兩個步驟比喻成警察抓小偷的偵查過程的話,那接下來最重要的攻堅(jiān)工作便是抓住作弊分子與進(jìn)行安全升級。
在偵查完之后,M君和組員們需要從多個維度進(jìn)行分析確認(rèn)新出現(xiàn)的問題是否存在炒作點(diǎn)評的特征,如果有的話則將不同問題的特征提煉歸納出來,進(jìn)行算法設(shè)計(jì),驗(yàn)證可行后即上線,而這正是誠信團(tuán)隊(duì)的重中之重。
“基于以前的作弊與反作弊工作,現(xiàn)在我們已經(jīng)有100種左右的算法,”M君表示,第三方炒作機(jī)構(gòu)和不法分子跟進(jìn)得很快,如果發(fā)現(xiàn)之前造假規(guī)則通不過的話會嘗試變換其他的方式,“現(xiàn)在每周都仍有新算法跟進(jìn)炒作點(diǎn)評。”
據(jù)了解,大眾點(diǎn)評已有100種左右的算法來篩選虛假點(diǎn)評。與此同時,還與美國數(shù)據(jù)挖掘協(xié)會輪值主席Bing Liu及其研究團(tuán)隊(duì)進(jìn)行基礎(chǔ)反作弊算法的合作研究,并借鑒了美國信用卡盜卡識別的先進(jìn)算法,在技術(shù)上走在Yelp、淘寶等公司的前面。
特別提醒:本網(wǎng)內(nèi)容轉(zhuǎn)載自其他媒體,目的在于傳遞更多信息,并不代表本網(wǎng)贊同其觀點(diǎn)。其原創(chuàng)性以及文中陳述文字和內(nèi)容未經(jīng)本站證實(shí),對本文以及其中全部或者部分內(nèi)容、文字的真實(shí)性、完整性、及時性本站不作任何保證或承諾,并請自行核實(shí)相關(guān)內(nèi)容。本站不承擔(dān)此類作品侵權(quán)行為的直接責(zé)任及連帶責(zé)任。如若本網(wǎng)有任何內(nèi)容侵犯您的權(quán)益,請及時聯(lián)系我們,本站將會在24小時內(nèi)處理完畢。