
特別鳴謝(按拼音排序)

報告摘要
面向業(yè)務場景,知識圖譜應用趨勢分析
· 知識圖譜面向業(yè)務場景,強調行業(yè)知識與知識圖譜的結合,實現(xiàn)在業(yè)務場景中的落地應用;
· 知識圖譜的核心優(yōu)勢體現(xiàn)在對于實體、屬性等客觀世界事物的關聯(lián)關系分析,尤其是隱性關系識別,可應用于輔助決策;
· 基于知識圖譜構建的領域知識庫應用,有效沉淀行業(yè)知識,賦能多業(yè)務場景;
· 注重行業(yè)知識圖譜和關系挖掘,是人工智能在行業(yè)中更深層的落地應用。
最佳實踐案例,對于知識圖譜構建有重要指導意義
· 知識圖譜已經(jīng)在垂直領域內有一定的成功應用案例,本報告總結在金融行業(yè)、醫(yī)療與醫(yī)藥行業(yè)、政府與公共服務行業(yè)以及能源與工業(yè)行業(yè)中六個應用場景的最佳實踐案例;
· 最佳實踐案例對于知識圖譜落地有重要的指導意義,企業(yè)可根據(jù)同行業(yè)內最佳實踐案例制定符合自身業(yè)務需求的知識圖譜解決方案,實現(xiàn)快速落地、及時應用。
從感知智能到認知智能,知識圖譜是關鍵一步
· 認知智能時代的到來,是在感知智能之上,提高了AI的理解分析能力。知識圖譜起到重要的支撐作用。在認知智能階段,機器能夠通過知識圖譜挖掘隱性關系,洞察難以發(fā)現(xiàn)的關系和邏輯,用于最終的業(yè)務決策。
目錄
一. 知識圖譜技術概覽
二. 知識圖譜應用分析與落地挑戰(zhàn)
三. 知識圖譜最佳實踐案例
四. 知識圖譜未來展望
結語
關于愛分析
法律聲明
1.知識圖譜技術概覽
1.1 知識圖譜概述
1.1.1知識圖譜定義
知識圖譜即Knowledge Graph,以結構化的方式描述客觀世界中實體、概念、事件以及之間的關系。其中,實體是指客觀世界的具體事物;概念是指人類對于客觀事物的概念化描述表示;事件是指發(fā)生在客觀世界的活動,而關系則指實體、概念、事件之間客觀存在的關聯(lián)。
知識圖譜技術是指在建立知識圖譜中使用的技術,是融合認知計算、知識表示與推理、信息檢索與抽取、自然語言處理與語義Web、數(shù)據(jù)挖掘與機器學習等技術的交叉研究。知識圖譜技術包括知識表示、知識圖譜構建和知識圖譜應用三方面的研究內容:
知識表示研究客觀世界知識的建模,以方便機器識別和理解,既要考慮知識的表示與存儲,又要考慮知識的使用和計算;
知識圖譜構建解決如何建立計算機算法從客觀世界或者互聯(lián)網(wǎng)的各種數(shù)據(jù)資源中獲取客觀世界的知識,主要研究使用何種數(shù)據(jù)和方法抽取何種知識;
知識圖譜應用主要研究如何利用知識圖譜建立基于知識的智能服務系統(tǒng),更好地解決實際應用問題。
1.1.2知識圖譜發(fā)展歷程
谷歌于2012年正式提出知識圖譜(Knowledge Graph)概念,并應用在智能搜索領域。知識圖譜(Knowledge Graph)本質是以圖的形式表現(xiàn)實體(概念、事物、人)及其關系的知識庫,可看作有向圖結構的網(wǎng)絡。目前,知識圖譜技術已在智能搜索、智能問答、網(wǎng)絡分析、決策輔助、推薦系統(tǒng)等領域廣泛應用。
通過知識圖譜的發(fā)展歷程可以看出,知識圖譜是知識工程不斷發(fā)展衍生出的新一代知識工程技術。2012年谷歌知識圖譜項目之后,知識圖譜技術快速發(fā)展,目前已形成在多垂直領域的行業(yè)應用。

1.1.3知識圖譜的構建體系
知識圖譜構建過程主要分為自頂向下(top-down)與自底向上(bottom-up)兩種方式。兩種方式的主要區(qū)別在于,在構建的過程中是否先定義本體與數(shù)據(jù)模式。目前,大多數(shù)知識圖譜采用自底向上的方式進行構建。
在知識圖譜的構建過程中,存在幾項關鍵步驟,即知識抽取、知識表示、知識融合、知識推理、知識存儲以及知識圖譜應用等。
其中,知識抽取與知識融合環(huán)節(jié)是知識圖譜構建的基礎。通過客戶數(shù)據(jù)庫或公開網(wǎng)絡獲取到多源異構數(shù)據(jù)具有冗余、噪聲、不確定性等特征,前期的數(shù)據(jù)清洗工作并不能實際解決這些問題,需要對相關數(shù)據(jù)抽取后進行融合操作并對質量進行評估,以便及時知識更新,保證知識圖譜的準確性。同時,已有知識構建數(shù)據(jù)模型形成數(shù)據(jù)規(guī)范作用于知識表示的過程可以及時對數(shù)據(jù)模型進行修訂,保證數(shù)據(jù)模型針對特定數(shù)據(jù)的實時性與有效性。
知識圖譜的前期構建過程即知識抽取與知識融合,各廠商在技術層面大致趨同,更多的是基于人力與時間的投入。知識圖譜發(fā)展至今,決定應用效果的更多是應用模型,即特定應用場景下相對應的應用模型。

1.1.4知識圖譜應用特性

知識圖譜技術源于語義網(wǎng)絡,經(jīng)過半個世紀的發(fā)展,融合本體論、群體智能使得知識圖譜又形成自身特點。在實際業(yè)務應用中,知識圖譜技術有以下特征:
可視化:知識圖譜作為圖類型知識庫,本身具備可視化特性。知識圖譜可以將多實體間的關系通過圖形的方式進行顯示。目前,通過知識圖譜技術分析展示實體間關聯(lián)關系已在多領域有廣泛的應用;
準確性:知識圖譜構建的語義網(wǎng)絡中具有多種語義關系,多角度挖掘信息,保證相關信息的準確性;
關聯(lián)分析:知識圖譜本身具備“邊”的概念,強調實體間的關聯(lián)與屬性。在實際業(yè)務場景中,利用知識圖譜技術能快速有效地發(fā)現(xiàn)無關實體間的隱性關聯(lián)關系。目前,關聯(lián)分析在金融行業(yè)的營銷與風控,政府與公共服務行業(yè)智能刑偵、智能經(jīng)偵、治安管理、政務數(shù)字化等多領域有廣泛應用;

拓展性:知識圖譜本身的構建方式?jīng)Q定其本身具有良好的拓展性,當形成某細分領域知識圖譜后可在此領域內快速拓展。同時,不同領域間知識圖譜也有一定的拓展性,本身知識抽取與知識融合階段對領域業(yè)務知識依賴有限,決定知識圖譜領域內應用效果的關鍵因素是上層業(yè)務模型;
可解釋性:彌補機器學習的不足,知識圖譜本身與人類認知類似,通過實體、關系、屬性去認知世界,同時知識圖譜目前均為大規(guī)模知識庫,語義豐富,將搜索問題與答案相連接,提供解釋性的來源;
知識學習:通過推理、標注、糾錯等具有反饋能力的學習機制,快速積累沉淀行業(yè)知識,形成領域知識庫,降低行業(yè)經(jīng)驗的依賴性。
2.知識圖譜應用分析與落地挑戰(zhàn)
2.1知識圖譜應用分析
知識圖譜可為多領域客戶在數(shù)據(jù)管理、關聯(lián)分析、營銷與風控、反欺詐等應用場景提供技術賦能。知識圖譜技術為用戶提供了一種更為有效的方式表達、組織、管理以及利用多源、異構、動態(tài)的數(shù)據(jù)。通過對于各領域內應用場景的分析,可以看出目前知識圖譜應用場景的共性特點:
圖譜的核心優(yōu)勢體現(xiàn)在對于實體、屬性等客觀世界事物的關聯(lián)關系分析,包括顯性關系與隱性關系識別?;谥R圖譜此項特性,銀行營銷與風控、公安刑偵等較多業(yè)務場景都有應用。也是目前知識圖譜技術應用最為廣泛的功能點。構建實體關系網(wǎng)絡,察覺實體關系,并發(fā)現(xiàn)信息(包括:風險消息、商機線索、關系事件)的傳導路徑,也會在其他行業(yè)中逐漸獲得廣泛應用;同時,關系網(wǎng)絡的搭建結合目前數(shù)據(jù)可視化(二維以及三維展示)的技術,將會更好地給用戶呈現(xiàn)實體關系網(wǎng)絡;

領域知識庫的應用也在各行業(yè)內廣泛推廣,相較于傳統(tǒng)知識工程,利用知識圖譜技術搭建領域知識庫的實際應用效果更好;由于傳統(tǒng)知識工程知識相對分散,關聯(lián)性低,要求使用者對于知識應用的匹配度較高,同時無法延伸知識的應用場景,所以傳統(tǒng)知識工程往往應用效果一般。在搭建領域知識庫的過程中,知識圖譜實現(xiàn)了知識的建模、抽取、融合、存儲、應用,同時將相關知識進行關聯(lián),達到智能化的知識應用水平;

自然語言處理(NLP)技術與知識圖譜技術之間存在較大交叉,面對復雜語義,可以利用知識圖譜技術與自然語言處理相結合的應用,更好的服務與長文本處理;傳統(tǒng)自然語言處理對于短文本有較好的處理效果,但面對長文本,尤其前后具備邏輯關系的語言,往往處理較差。知識圖譜技術的應用解決長文本與長語句處理問題,使得智能客服、機器翻譯、文本處理等應用有長足的發(fā)展。

2.2知識圖譜落地應用場景
愛分析基于對國內知識圖譜廠商的調研,準確定義了23個知識圖譜技術的應用場景,涵蓋金融、政府與公共服務、電信、醫(yī)療與醫(yī)藥、零售、能源與工業(yè)等六大行業(yè)。本報告應用場景只選取具有較強行業(yè)屬性的應用場景進行研究分析,并沒有窮舉知識圖譜所有應用場景。
知識圖譜應用場景地圖如下圖所示:

2.3知識圖譜各場景應用分析
通過知識圖譜應用場景地圖可以看出,目前在六大行業(yè)中,金融行業(yè)以及政府與公共服務行業(yè)知識圖譜落地場景較多,其中主要以金融行業(yè)內的營銷與風控場景和公共安全行業(yè)的業(yè)務場景居多。本章節(jié)將結合各行業(yè)具體落地場景分析目前知識圖譜的應用現(xiàn)狀。
2.3.1金融行業(yè)知識圖譜應用場景分析
(1)金融行業(yè)營銷與風控業(yè)務場景應用分析:
在對公業(yè)務的激烈競爭中,銀行需要增強對企業(yè)關聯(lián)關系網(wǎng)中產生的商機事件的洞察能力,及時抓住營銷窗口期;
隨著宏觀經(jīng)濟環(huán)境不確定性的增加,銀行需要增強對企業(yè)關聯(lián)關系網(wǎng)中傳導的行業(yè)景氣度波動、重大負面事件等風險事件的洞察能力,建立重大風險事件快速響應和應急處置機制,及時發(fā)現(xiàn)潛在風險,提高風險監(jiān)測與預警能力;
知識圖譜可以為銀行對公業(yè)務實現(xiàn)跨行業(yè)和跨企業(yè)的關系網(wǎng)絡的構建,重塑對公業(yè)務營銷與風控的過程,提升風險管理和營銷管理的效率,特別是在反洗錢、反欺詐、輿情風控等環(huán)節(jié)中,知識圖譜可以起到關鍵作用;
國內銀行目前正在積極進行線上零售轉型,大力發(fā)展個貸、微貸業(yè)務,需要增強對零售客戶的數(shù)據(jù)洞察能力,挖掘客戶的真實需求,實現(xiàn)千人千面,從而實現(xiàn)精準觸達;
伴隨著業(yè)務的發(fā)展,背后隱藏的風險也日益凸顯,“薅羊毛”、親友集中借貸、“壘大戶“等問題頻發(fā),因此,貸前審查和貸后管理中對于客戶之間關聯(lián)關系的識別非常重要;
通過構建關聯(lián)圖譜,打通零售業(yè)務場景下客戶從申請到貸后的全流程數(shù)據(jù),建立零售客戶全業(yè)務周期畫像、客戶關系畫像,可以使銀行在縮短營銷周期、降低營銷成本的同時確保風險可控。
(2)金融行業(yè)構建金融領域知識庫業(yè)務場景應用分析:
金融機構內部在業(yè)務運行過程中累積了大量的知識與經(jīng)驗,這些知識與經(jīng)驗存在于領域專家腦中或技術文檔中,難以得到有效利用,很多金融機構嘗試使用知識管理系統(tǒng),但知識管理系統(tǒng)中的知識與知識之間存在信息孤島,沒有建立知識之間的聯(lián)系,知識的管理維護、更新升級等也都存在問題;基于知識圖譜,可以有效將知識與業(yè)務進行關聯(lián),有效管理知識體系的同時更好地賦能業(yè)務;
在將知識圖譜技術應用于營銷、風控等業(yè)務環(huán)節(jié)的過程中,本質上是建立了營銷領域和風控領域的知識庫,隨著知識圖譜技術在金融行業(yè)的滲透,金融機構開始想要打造全公司級別的知識庫或知識中臺,將全公司的數(shù)據(jù)進行關聯(lián),滿足不同業(yè)務部門的需求,更好的推動業(yè)務運行。
?。?)金融行業(yè)在智能客服業(yè)務場景應用分析:
隨著人工客服成本的逐年上漲,客服機器人在金融領域已經(jīng)開始廣泛使用,但在金融領域使用的客服機器人不同于一般的聊天機器人,對回答準確率的要求較高,現(xiàn)階段,客服機器人只能作為人工客服的輔助和補充,主要應用在人工客服人手不足或是對服務質量要求不高的場景上;
金融機構對客服機器人的智能化水平要求不斷增加,需要客服機器人對問題中模糊的部分通過上下文對話的關聯(lián)進行意圖識別,給客戶帶來更好的服務體驗;
基于知識圖譜技術的客服機器人,可以理解用戶意圖,實現(xiàn)上下文交互的對話流程。
2.3.2政府與公共服務行業(yè)知識圖譜應用場景分析
(1)公共安全行業(yè)刑偵、經(jīng)偵、反恐、治安管理等業(yè)務應用分析:
目前公共安全行業(yè)的智能化應用主要停留在感知智能,強調前端數(shù)據(jù)的采集以及后端視頻解析能力,認知智能的應用推廣有限,導致公安數(shù)據(jù)信息規(guī)模龐大、數(shù)據(jù)復雜。辦案人員需要將海量數(shù)據(jù)快速抽取成知識,發(fā)現(xiàn)有用信息;
違法犯罪活動本身具備隱蔽性、團伙性等特征,在技術高速發(fā)展的背景下,又呈現(xiàn)出網(wǎng)絡化、智能化、復雜化等新特征,增加了公安人員的辦案難度。面對當前的公安業(yè)務新挑戰(zhàn),公安部門推動公安系統(tǒng)智能化改造,打破系統(tǒng)原有信息孤島,挖掘潛在隱藏信息,分析關聯(lián)關系,形成知識網(wǎng)絡,通過技術手段支撐“人、事、地、物、組織”等刑偵關鍵要素;
案件的核心是“人”,在經(jīng)濟犯罪過程中,關鍵人員一定會留痕于關系網(wǎng)絡,但關鍵在于,面對錯綜復雜的海量數(shù)據(jù),經(jīng)偵部門需要梳理脈絡,利用知識圖譜,形成人員、企業(yè)等要素的關系網(wǎng)絡,搜尋關鍵線索,挖掘深層次信息;
由于暴恐事件具有團伙性、隱蔽性以及線上與線下關聯(lián)性等特征,公安機關需對重點人員布控,基于知識圖譜利用車輛與人員軌跡、同行人等數(shù)據(jù)建立風險預測模型,發(fā)掘隱性重點人員,形成團伙關系網(wǎng)絡,通過團伙聚集度、活躍度、危險度等多維度信息對團伙進行布控設防;
治安事件發(fā)生具有突然性,當團伙發(fā)生案件時,若不能現(xiàn)場及時抓捕,后期可通過涉案人員關系圖譜發(fā)掘潛在嫌疑人;針對有一定犯罪企圖的重點人員,利用智能手段,建立重點人員預警模型,并通過關系圖譜與軌跡信息,及時發(fā)現(xiàn)違法活動,阻止治安事件發(fā)生。
?。?)交通行業(yè)業(yè)務場景應用分析:
面對城市交通擁堵問題,利用知識圖譜技術,將前端感知設備采集數(shù)據(jù)形成人、車、道理的大交通關系圖譜,通過交通業(yè)務模型,利用路口信號燈實時調度城市交通系統(tǒng);
針對突發(fā)情況導致的道路無法通行,交通部門需要快速響應進行路徑規(guī)劃,合理指揮車輛規(guī)避風險路段,將影響降到最小。將時空概念引入,利用動態(tài)知識圖譜技術,更快速的進行道路規(guī)劃;
電警、卡口、人臉抓拍攝像機的廣泛應用使得交通大數(shù)據(jù)中具有海量車牌與人臉照片,通過知識圖譜技術可以快速構建人、車關系圖譜,交管部門可以快速檢索居民與同行人的軌跡信息。
(3)政務數(shù)字化業(yè)務場景應用分析:
在政務數(shù)字化的建設過程中,政府各部門主導建立業(yè)務系統(tǒng),導致系統(tǒng)之間形成“信息孤島”,不能有效的統(tǒng)一調度。采用知識圖譜等新興技術,平臺將部門壁壘與信息孤島現(xiàn)象打破,形成統(tǒng)一的數(shù)據(jù)標準規(guī)范服務業(yè)務應用;
目前各級政府部門已形成海量數(shù)據(jù)資源池,但真正能服務于業(yè)務的數(shù)據(jù)應用卻較少。采用知識圖譜技術,平臺將各部門數(shù)據(jù)抽取融合形成知識,搭建政務領域知識中臺,為上層各業(yè)務部門工作提供知識支持;
政府對于社會的宏觀調控需要多維數(shù)據(jù)支撐,需要挖掘社會關鍵要素之間的隱性關系,輔助政府部門決斷。知識圖譜技術具有較強的關聯(lián)關系分析能力,通過社會要素的關聯(lián)分析與模型推算,在宏觀調控、社會管控、政策實施、災害防控等多方面為政府決策提供數(shù)據(jù)支撐。
2.3.3醫(yī)療與醫(yī)藥行業(yè)知識圖譜應用場景分析
(1)藥企業(yè)務場景應用分析:
從藥物研發(fā)到臨床試驗再到上市推廣,醫(yī)學翻譯貫穿于藥企的整個業(yè)務生命周期中,醫(yī)療的特殊性使得藥企對醫(yī)學翻譯的專業(yè)性提出極高的要求;
基于知識圖譜的機器翻譯,通過構建專業(yè)領域的知識體系,可以極大提高醫(yī)學翻譯的專業(yè)性和準確性,使翻譯結果更加符合醫(yī)學邏輯,保證翻譯質量;
“4+7”帶量采購使得跨國藥企面臨藥價下調的壓力,產品的覆蓋力度和頻率下降,亟需快速挖掘新市場以及提高對原有覆蓋客戶的精準營銷;在醫(yī)藥營銷“合規(guī)”的背景下,“帶金銷售”的醫(yī)藥代表模式走不通,數(shù)字化營銷成為藥企實現(xiàn)合規(guī)、高效、低成本的營銷手段;
藥企通過搭建自己的知識體系平臺或問答平臺,構建產品知識圖譜、疾病知識圖譜、用藥知識圖譜等,可以精準地為醫(yī)生推送其感興趣的內容,幫助醫(yī)生正確用藥、正確做治療,提高醫(yī)生對藥企產品的認可度。
?。?)醫(yī)院業(yè)務場景應用分析:
患者去醫(yī)院就診時,經(jīng)常會遇到“知癥不知病”、“知病不知科”的問題,現(xiàn)有的導診方式一般為人工導診或基于關鍵詞的導診系統(tǒng),導診的效率和效果有待提升;為患者提供精準的智能導診服務,不僅可以為患者快速找到合適的科室和合適的醫(yī)生,減少患者就診時間,同時可以緩解醫(yī)務人員工作壓力、促進醫(yī)療資源合理配置;
基于知識圖譜的智能導診系統(tǒng),借助知識圖譜的推理能力,患者只需描述癥狀或疾病,就可以為患者提供智能導診服務,匹配科室和醫(yī)生,緩解醫(yī)院導診服務的壓力,提高醫(yī)院的智能化管理水平。
2.3.4能源與工業(yè)行業(yè)知識圖譜應用場景分析
國內工業(yè)水平發(fā)展參差不齊,長期的行業(yè)不景氣導致企業(yè)信息化發(fā)展較慢,目前大部分企業(yè)數(shù)據(jù)粗放式管理,可用性與易用性較差,難以形成知識積累。隨著競爭加劇,以電力、石化、工業(yè)、水務為代表的資源密集型企業(yè)加速向技術密集型與數(shù)字密集型企業(yè)轉型,提高企業(yè)數(shù)字化能力;
面對能源與工業(yè)行業(yè)的業(yè)務挑戰(zhàn),企業(yè)需求將數(shù)據(jù)形成知識,創(chuàng)建支持上層業(yè)務應用的領域知識庫,在輔助業(yè)務應用的同時進行相應的知識積累。員工可通過知識庫快速獲取知識,降低培訓與研發(fā)成本。
2.3.5電信行業(yè)知識圖譜應用場景分析
市場已經(jīng)趨近于飽和的電信行業(yè),提高服務質量是運營商爭取客戶的重要舉措。由于人工客服的培訓流程較長且人員流動性較強,建立運營商領域知識庫是快速提高客服人員服務質量的有效方法??头藛T通過檢索知識庫獲取知識,快速、準確地回答客戶問題;
5G時代的到來,運營商更注重下沉市場。但對下沉市場的運營需要大量資源投入。建立運營商領域知識庫,一線工作人員可以通過檢索知識庫的方式快速獲取知識;
運營商利用知識圖譜技術通過對購買人的關聯(lián)關系圖譜分析,可以快速獲取潛在客戶群體,發(fā)掘隱性商機。
2.3.6零售行業(yè)知識圖譜應用場景分析
在零售數(shù)字化的進程中,零售商獲取了大量消費者、商品以及門店的數(shù)據(jù),但數(shù)據(jù)的價值在于發(fā)現(xiàn)三者的關聯(lián)關系。通過知識圖譜技術,零售商構建商品知識圖譜,以商品為核心,發(fā)掘三者的隱性關系,輔助商品營銷;
門店選址時,品牌商要高效、準確的選擇新區(qū)域內最佳位置。通過大量的門店數(shù)據(jù),基于知識圖譜技術,可快速構建門店領域知識庫,幫助企業(yè)根據(jù)產品類型快速發(fā)現(xiàn)區(qū)域內的空白市場點位,輔助決策人完成門店選址工作。
2.4 知識圖譜的落地關鍵舉措及挑戰(zhàn)
2.4.1知識圖譜落地的關鍵步驟
由1.1.3節(jié)可以看出,知識圖譜的關鍵步驟包括知識抽取、知識融合、知識推理、知識存儲與知識應用等關鍵五步。其中,知識抽取與知識融合環(huán)節(jié)共同完成知識構建,在知識構建的構建的過程,從海量數(shù)據(jù)中抽取概念、實體、關系和屬性,并進行消歧、對齊和融合。

知識抽取:面對海量的數(shù)據(jù)源,在構建知識圖譜的過程中,需要自動化的技術抽取可用的知識單元,其中知識單元包含實體、屬性與關系三個要素。并通過不斷形成的知識單元,形成知識表達,為上層的構建提供基礎能力;
可以看出,知識抽取即可拆分為實體抽取、關系抽取以及屬性抽取的技術。其中由于屬性抽取主要針對實體可以看成是實體與屬性值之間的關系抽取問題,所以屬性抽取技術可以借鑒使用關系抽取技術的相關思想。實體抽取也可認為是命名實體的學習與識別,即從原始的語料中自動識別出命名實體;
實體是知識圖譜中的最基本元素,其抽取的完整性、準確率、召回率等將直接影響到知識庫的質量。因此,實體抽取是知識抽取中最為基礎與關鍵的一步。

知識融合:知識融合是針對于知識質量問題,進行高層次的知識組織,使來自不同知識源的知識在同一框架規(guī)范下進行異構數(shù)據(jù)整合、消歧、加工、推理驗證、更新等步驟,達到數(shù)據(jù)、經(jīng)驗以及人的思想的融合,形成高質量的知識庫;
知識融合技術主要包括實體對齊、知識加工、知識更新。其中實體對齊也稱為實體匹配或實體解析,主要是用于消除異構數(shù)據(jù)中的實體沖突、指代不明等問題。在通過實體對齊后,已形成知識的雛形,但未形成知識體系,需要通過知識加工進行構建。知識更新主要作用于知識體系,進行不斷的迭代更新,拓展知識。

知識推理:知識推理也為知識計算,是結合行業(yè)Know-How,計算知識中的顯性與隱性關系和拓展屬性;是在知識庫的基礎上進一步挖掘隱含的知識,豐富知識庫。目前行業(yè)內的隱性關系挖掘,如銀行業(yè)零售與營銷業(yè)務場景、公安智能刑偵、公安智能經(jīng)偵場景中的隱性關系挖掘,風險傳導識別都是基于知識圖譜的知識推理能力。知識推理的方法主要有三種,其中基于邏輯的推理方法以及基于圖的推理是最主要的兩種類別的方法。同時,行業(yè)內正在研究跨知識庫的推理方法。

知識存儲:知識存儲保障知識圖譜平臺順利運行,是關鍵的知識圖譜基礎。目前行業(yè)內主流的存儲模式有三種:RDF(Resource Description Framework),即資源描述框架、關系型數(shù)據(jù)庫以及圖數(shù)據(jù)庫。由于關系型數(shù)據(jù)庫存儲圖數(shù)據(jù)可以很好的解決單條數(shù)據(jù)查詢的問題,在存儲效率和查詢效率上都有很大的優(yōu)勢。同時,關系型數(shù)據(jù)庫是目前最成熟也應用最廣的數(shù)據(jù)庫。但對于關系的實時查詢以及深度關聯(lián)查詢時,關系型數(shù)據(jù)庫不能做好很好的支持。圖數(shù)據(jù)庫相對而言有著高性能的表現(xiàn),在數(shù)據(jù)靈活性以及開發(fā)敏捷性方面,圖數(shù)據(jù)庫有較大優(yōu)勢。RDF本質上為數(shù)據(jù)模型,提供統(tǒng)一標準描述實體,能夠較好的用圖描述,但存在設計不夠靈活、存儲空間大等問題;
在實際項目中,要實際根據(jù)數(shù)據(jù)特點進行數(shù)據(jù)存儲結構選擇與設計,而且目前沒有任何一種通用的存儲方式可以解決所有的問題,每一種存儲方式都存在自身的局限性,所以在項目中要靈活配置使用數(shù)據(jù)存儲結構。

知識應用:在2.1節(jié)可以看到,目前知識圖譜技術在垂直行業(yè)已有較多應用場景。目前,知識圖譜的構建和使用是以應用場景為導向。在行業(yè)內尋求應用場景,理解用戶核心需求,判斷是否能應用知識圖譜后,再根據(jù)應用場景構建知識圖譜;
在整個知識圖譜的知識應用過程中;有兩個核心關鍵點:1)找到業(yè)務與知識圖譜技術的結合點,結合點的選取將直接影響實際應用效果。2)知識圖譜的schema的設計,不同行業(yè)的知識體系不完全一樣,具有較強的領域性,在設計schema的過程要求業(yè)務專家與技術人員協(xié)作完成,這也是知識圖譜構建的難點;
知識圖譜技術作為感知智能向認知智能跨進的關鍵技術,在行業(yè)內的應用場景會逐步地增加,相較于其他人工智能技術,知識圖譜技術需要與行業(yè)Know-How有深度結合,更多的業(yè)務專家參與知識圖譜的構建過程,會更有利于知識圖譜的落地,

2.4.2知識圖譜落地的“一核兩翼”
上一小節(jié)可以看到,知識圖譜技術落地的關鍵步驟為:知識構建(知識抽取與知識融合)、知識推理、知識存儲與知識應用。其中,針對上一節(jié)中關鍵步驟中影響因素進行提煉總結,可得到?jīng)Q定知識圖譜技術落地效果好壞的三大關鍵因素,本報告總結為“一核兩翼”,即專業(yè)團隊、數(shù)據(jù)與算法模型。
“一核兩翼”中“一核”指的專業(yè)團隊,這里的專業(yè)團隊指行業(yè)專家與技術專家和用戶共同組成的團隊。行業(yè)專家與技術專家配合構建專業(yè)領域知識圖譜,客戶與技術專家完成知識圖譜后期的運營與知識更新,讓知識圖譜“跑起來”。在“兩翼”能力越來越接近的今天,專業(yè)團隊對于項目應用的影響是決定性的。
“兩翼”指數(shù)據(jù)與算法模型,知識圖譜是連接數(shù)據(jù)知識與業(yè)務場景的關鍵技術,數(shù)據(jù)在整個知識圖譜構建的過程中起到?jīng)Q定性作用,但由于數(shù)據(jù)來源廣泛、各行業(yè)數(shù)據(jù)質量參差不齊,對于數(shù)據(jù)的治理、標注與知識圖譜構建中的知識抽取加工的工作是老生常談的難題,后面應用過程中的數(shù)據(jù)查詢、分類也存在挑戰(zhàn)。
算法模型則是支撐知識圖譜自動化應用的核心,算法模型涵蓋知識圖譜構建的全流程工作,從最開始的數(shù)據(jù)治理到最終的應用查詢,是知識圖譜廠商技術實力與行業(yè)Know-How能力的體現(xiàn)。數(shù)據(jù)與算法模型的配合應用支撐知識圖譜的行業(yè)落地。

2.4.3知識圖譜技術落地挑戰(zhàn)
實際應用過程中,知識圖譜在落地中會出現(xiàn)很多挑戰(zhàn)與困難,而其實知識圖譜落地出現(xiàn)的困難正是由于廠商與用戶在構建“一核兩翼”能力過程中出現(xiàn)問題,典型挑戰(zhàn)與困難可以歸納為“數(shù)據(jù)不精、業(yè)務不專、技術不強、配合不暢”。
數(shù)據(jù)不精:問題的核心是在部分信息化發(fā)展較緩慢的行業(yè),行業(yè)數(shù)據(jù)整體治理水平較差,甚至部分關鍵數(shù)據(jù)仍未進行有效管控,需要知識圖譜廠商進行合理的規(guī)劃建設。但知識圖譜廠商并非數(shù)據(jù)中臺廠商,知識圖譜廠商更強調基于有效的數(shù)據(jù)進行上層應用的建設。對于海量數(shù)據(jù)的治理工作能力有限,造成項目工期延長或適當降低項目功能預期等情況。隨著各行業(yè)信息化以及數(shù)字化建設的推廣,數(shù)據(jù)中臺產品也將得到較好的推廣,未來基于數(shù)據(jù)中臺產品之上進行知識圖譜建設,將有效的緩解數(shù)據(jù)不精的問題;
業(yè)務不專:業(yè)務不專的核心在于廠商理解用戶需求,尋找知識圖譜與業(yè)務的結合點,有效的賦能業(yè)務場景。前面幾節(jié)已經(jīng)多次強調業(yè)務專家以及行業(yè)知識對于知識圖譜搭建的重要性;
知識圖譜schema的設計是需要業(yè)務專家的深度參與。由于不同行業(yè)、不同領域對于知識的需求天差萬別,所以很難出現(xiàn)跨行業(yè)通用的知識圖譜搭建工具。同時,知識圖譜的搭建過程本身也是一個行業(yè)知識的封裝過程,只有業(yè)務專家的參與,才能更好的形成真實契合行業(yè)需求的知識圖譜;
技術不強:知識圖譜在應用的過程中,針對算法模型的封裝、智能推理、搜索推薦、智能問答等多應用環(huán)節(jié)都存在一定的技術壁壘。同時,由于不同行業(yè)場景的需求不同,知識圖譜普遍在各行業(yè)落地過程中存在較大的定制工作量,需要廠商不斷的積累產品能力才能提高產品率,降低定制量;
配合不暢:知識圖譜作為一項無自身單獨使用場景的底層技術,需要技術人員與業(yè)務專家以及用戶方進行有效配合。知識圖譜項目很難單獨依靠廠商自身能力單獨完成項目。在落地的過程中,業(yè)務專家與技術專家對于甲方用戶需求的理解、應用場景的選擇,都來源于項目實施過程中的配合。用戶、業(yè)務專家與技術專家良好的配合將有效促進項目落地的使用效果。
3.知識圖譜最佳實踐案例
知識圖譜已經(jīng)在垂直領域內有一定的成功應用案例,本報告總結在金融行業(yè)、醫(yī)療與醫(yī)藥行業(yè)、政府與公共服務行業(yè)以及能源與工業(yè)行業(yè)中的六個最佳實踐案例。
最佳實踐案例對于知識圖譜落地有重要的指導意義,企業(yè)可根據(jù)同行業(yè)內最佳實踐案例制定符合自身業(yè)務需求的知識圖譜解決方案,做到快速落地、及時應用。
3.1金融行業(yè)最佳實踐案例
3.1.1銀行對公業(yè)務營銷與風控場景最佳實踐案例
對公業(yè)務營銷與風控是銀行的核心業(yè)務場景之一,但對公業(yè)務競爭激烈,銀行需要增強事件驅動的商機洞察能力,及時抓住營銷窗口期。同時,國內存在大量由企業(yè)連環(huán)擔保形成的“擔保圈”,潛在傳導風險大,隨著宏觀經(jīng)濟不確定性因素的增加,銀行需要增強對“擔保圈”企業(yè)關聯(lián)關系的洞察能力,從而及時預知和抵御風險。
知識圖譜技術目前已在銀行對公業(yè)務營銷與風控場景有成功應用。在幫助銀行構建知識圖譜的過程中,知識圖譜廠商應具備以下能力:
銀行數(shù)據(jù)量巨大,需要廠商具備大規(guī)模知識圖譜構建能力;
快速融合銀行內外部相關數(shù)據(jù),快速構建銀行內部的知識圖譜平臺;
以知識圖譜技術為核心,同時具備開發(fā)業(yè)務模型、構建客戶標簽體系等能力;
兼容性強,既可以作為獨立的知識圖譜平臺,又可以與其他平臺相對接,對外輸出知識。
星環(huán)科技拓展知識圖譜能力,賦能銀行對公風控與營銷場景
風險管理涉及銀行核心業(yè)務板塊,但傳統(tǒng)風控體系依靠專家規(guī)則與巴賽爾協(xié)議的各項指標,指標對于先驗的專家規(guī)則存在較強的依賴性,對于未發(fā)現(xiàn)的異常點無從下手。
同時,各業(yè)務子系統(tǒng)中存在海量數(shù)據(jù),如何在海量數(shù)據(jù)中挖掘有價值的信息,并進行有效的關聯(lián)融合,打破各業(yè)務子系統(tǒng)的數(shù)據(jù)孤島問題,亟待行方解決。
知識圖譜能夠用數(shù)據(jù)做一系列的衍生類操作,賦能銀行具體業(yè)務的營銷與風控。某股份制商業(yè)銀行信息科技部負責人表示:“知識圖譜在金融方面的應用主要是在拓客以及風險識別和反欺詐等領域,這些領域呈現(xiàn)的特點就是對數(shù)據(jù)大規(guī)模的應用,除此之外就是對圖譜圖算法時效性以及深層次推理能力有更高的要求。”
星環(huán)科技專注于企業(yè)級容器云計算、大數(shù)據(jù)和人工智能核心平臺的產品研發(fā),為用戶提供一站式、交互式的知識圖譜構建工具,支持圖譜構建、知識存儲、分布式圖譜計算以及圖譜案例分析。

某股份制商業(yè)銀行從2018年開始與星環(huán)科技合作建設知識圖譜分析應用體系,整體項目建設主要分為三個階段:圖譜構建、風險傳導算法研發(fā)、3D可視化分析。
第一步:完成對公企業(yè)客戶的知識圖譜構建;
第二步:基于已構建的對公企業(yè)知識圖譜,進行風險傳導算法研發(fā)與應用;
第三步:實現(xiàn)知識圖譜的3D可視化分析,對接各業(yè)務應用平臺。
知識圖譜平臺功能主要包括圖譜存儲、圖譜分析、圖譜可視化和圖譜應用四個方面,用于客戶精準營銷、風險防控、運營優(yōu)化以及管理決策。特別在風險防控方面,借助知識圖譜平臺快速建立不同場景風控圖譜,借助圖算法分析異常行為;同時,知識圖譜平臺支持信息動態(tài)更新以及風險計算的實時調用。

整體知識圖譜平臺由存儲計算層、自動化建模層以及決策層組成:
存儲計算層:在存儲計算層強調多模態(tài)數(shù)據(jù)的應用,目前是包含四類的數(shù)據(jù)庫,其中最主要就是圖數(shù)據(jù)庫,來支持知識圖譜的存儲和計算;
自動化建模層:在自動化建模層主要提供四大能力的支撐,第一項能力是搭建金融領域的本體庫,第二項能力是在自動化建模平臺上進行有效圖譜的融合,實現(xiàn)圖數(shù)據(jù)和本體進行有效的連接。第三項能力是圖算法的分析能力。第四項能力是提供整個知識圖譜模型的調度以及監(jiān)控的能力;
決策層:重點是往四個方向去輸出知識圖譜的應用:精準營銷、風險防控、業(yè)務優(yōu)化以及管理決策。
知識圖譜平臺的價值體現(xiàn)在四個方面:
平臺構建完成企業(yè)關聯(lián)關系圖譜,涵蓋銀行客戶千萬個實體與實體之間的關系,并提供八大類關系檢索(法人、實控、集團、任職、擔保、投資、股東、交易關系)。目前平臺此項功能應用于新客的拓展以及集團關系認定等業(yè)務場景中;
實際計算中,單個風險點出發(fā)計算全局的風險值時間控制在1~4min;
平臺實現(xiàn)基于自然語言查詢的3D交互知識圖譜應用,支持用戶以自然語言輸出查詢的方式進行圖上檢索,降低圖數(shù)據(jù)的應用門檻,方便總行業(yè)務人員以及分行的分析人員使用;
平臺實現(xiàn)企業(yè)風險傳導的3D圖譜應用,實現(xiàn)企業(yè)風險在集團內部或者企業(yè)內部的動態(tài)穿透的分析能力。同時,對于分析人員,3D圖譜相較于2D平面圖譜有高幾十倍的點邊展示能力,且具有較強的解釋性,既可以展示企業(yè)風險分又可展示動態(tài)風險傳播路徑。
3.1.2銀行零售業(yè)務營銷與風控場景最佳實踐案例
零售業(yè)務營銷與風控是銀行的核心業(yè)務場景之一。在實際的業(yè)務場景中,用戶需求日益?zhèn)€性化、多元化,銀行需要增強用戶群體的數(shù)據(jù)洞察能力,挖掘用戶真實需求,并需要基于數(shù)據(jù)分析進行產品設計、渠道選擇和營銷策劃,實現(xiàn)千人千面,從而精準觸達用戶;同時,零售業(yè)務是存量市場的競爭,銀行需要批量拓展消費端場景,增強場景獲客能力;在零售信貸申請、交易、支付等環(huán)節(jié)中,對欺詐風險的抵御至關重要。
知識圖譜技術目前已在銀行零售業(yè)務營銷與風控場景有成功應用。在幫助銀行構建知識圖譜的過程中,知識圖譜廠商應具備以下能力:
零售業(yè)務線眾多,包含信用卡、貸款、理財、儲蓄等,要求廠商具備跨渠道、跨業(yè)務打通數(shù)據(jù)的能力,不僅對各個業(yè)務線有高度的理解,還要具備良好的服務意識;
以知識圖譜技術為核心,同時具備開發(fā)業(yè)務模型、構建客戶標簽體系等能力;
在項目實施過程中需要配備經(jīng)驗豐富的業(yè)務專家、算法專家和數(shù)據(jù)專家;
兼容性強,既可以作為獨立的知識圖譜平臺,又可以與其他平臺相對接,對外輸出知識。
以知識圖譜為動能,海致星圖賦能零售風控與營銷
某股份制商業(yè)銀行作為國內金融科技實踐的先驅,為提升數(shù)據(jù)價值不斷進行積極的探索。 目前已取得一定應用成果。
某股份制商業(yè)銀行信用卡中心客戶經(jīng)理需要每天關注手上數(shù)十家客戶的風險信息,更需要不斷的挖掘轄區(qū)內優(yōu)質潛在客戶的營銷機會。而這些風險和營銷的信號散落在行內外以及互聯(lián)網(wǎng)各處,靠客戶經(jīng)理個人能力不僅很難覆蓋,而且成本越來越高。
同時,由于企業(yè)間的復雜關系網(wǎng)絡,營銷機會與風險信息的傳導更難以捕獲。營銷機會流失的同時背后的風險也日益凸顯。
某股份制商業(yè)銀行信用卡中心通過構建知識圖譜平臺,打通零售業(yè)務場景下客戶從申請到貸后的全流程數(shù)據(jù),建立零售客戶全業(yè)務周期畫像、客戶關系畫像,可以使銀行在縮短營銷周期、降低營銷成本的同時確保風險可控。
海致星圖是一家致力于利用機器學習、知識圖譜等人工智能前沿技術,為金融領域提供專屬的數(shù)據(jù)、技術及業(yè)務解決方案的大數(shù)據(jù)公司,在金融行業(yè)大數(shù)據(jù)與人工智能應用領域,有著豐富的經(jīng)驗與廣泛的成功案例。
某股份制商業(yè)銀行信用卡中心與海致星圖合作,構建卡中心級支持多場景應用的知識圖譜平臺。平臺基于數(shù)據(jù)處理,實現(xiàn)關系圖譜的實時可視化事務查詢、基于知識圖譜的各類標簽輸出與圖挖掘功能。
同時,知識圖譜平臺與各業(yè)務系統(tǒng)對接以支撐業(yè)務部門應用,各部門在平臺上構建專屬圖模型,包括社群檢測、親密度評分、貸后失聯(lián)修復、社交網(wǎng)絡特征提取等,進一步實現(xiàn)客戶關系挖掘營銷與風險控制。

某股份制商業(yè)銀行信用卡中心在構建知識圖譜平臺過程中,對接全行30億+實體數(shù)據(jù)與120億+條關系邊數(shù)據(jù),涉及16類實體、18種基礎關系和28種挖掘類關系。平臺整合內外部數(shù)據(jù),構建企業(yè)間錯綜復雜的業(yè)務、控制、擔保等關系,實現(xiàn)風險與營銷信號在關系網(wǎng)絡傳導識別,服務業(yè)務應用。
某股份制銀行信用卡中心與海致星圖合作的知識圖譜平臺價值體現(xiàn)在四個方面:
銀行信用卡催收中心日常催收搜尋工作時長縮短25%,有效挖掘并修復的失聯(lián)客戶數(shù)提高23%;偽冒偵測中心有效識別了疑似欺詐團伙800余起,環(huán)比提升超過20%;
信用卡中心基于平臺進行批量發(fā)卡營銷部門的客戶觸達數(shù)環(huán)比提高18%;
信用卡中心基于平臺進行了關聯(lián)營銷潛客名單挖掘、行業(yè)營銷價值評估、上下游企業(yè)商機傳導等業(yè)務實踐,并進行了集團派系的構建和劃分;
信用卡中心基于平臺的算法與業(yè)務模型,先后進行了互保企業(yè)違約傳導分析、授信資金異常形態(tài)識別、擔保(圈、鏈、網(wǎng)絡)高風險節(jié)點識別、擔保違約風險預測等應用。

3.1.3金融行業(yè)領域知識庫最佳實踐案例
金融機構內部在業(yè)務運行過程中累積了大量的知識與經(jīng)驗,這些知識與經(jīng)驗存在于領域專家腦中或技術文檔中,難以得到有效利用,很多金融機構嘗試使用知識管理系統(tǒng),但知識管理系統(tǒng)中的知識與知識之間存在信息孤島,沒有建立知識之間的聯(lián)系,知識的管理維護、更新升級等也都存在問題。
在實際的業(yè)務場景中,將領域知識庫與實際業(yè)務相結合,可以有效的降低業(yè)務的上手難度,提高工作效率,同時將工作人員在重復的勞動中解放。知識圖譜技術目前已在金融領域知識庫的業(yè)務場景有成功應用。在幫助銀行構建知識圖譜的過程中,知識圖譜廠商應具備以下能力:
搭建全公司級別的知識庫或知識中臺涉及到的數(shù)據(jù)量巨大,需要廠商具備大規(guī)模知識圖譜平臺搭建能力;
知識庫或知識中臺要支撐上層多業(yè)務部門的應用,要求廠商搭建的知識圖譜平臺組件足夠靈活;
在項目實施過程中廠商需要配備經(jīng)驗豐富的業(yè)務專家、算法專家和數(shù)據(jù)專家;
兼容性強,既可以作為獨立的知識圖譜平臺,又可以與其他平臺相對接,對外輸出知識;
各個金融機構對知識庫或知識中臺的需求存在差異,廠商需具備定制化改造的能力,同時具備良好的服務意識;
除了知識圖譜技術以外,廠商還需要具備自然語言處理、圖計算等技術能力。
一覽群智助力某國有銀行上線智能審單專家系統(tǒng)
某大型國有銀行是國內領先的銀行業(yè)機構。單證業(yè)務中心是銀行重要的業(yè)務部門。但實際銀行單證業(yè)務是一個對專業(yè)性要求較高的復雜繁瑣工作,由于日常工作量較大,導致單證業(yè)務中心工作人員壓力較大、單證業(yè)務中心運營成本較高等諸多問題。
傳統(tǒng)單證業(yè)務痛點可總結為以下四方面:
成本高:例如跟單信用證、托收等具體的業(yè)務都涉及到對客戶交單的處理。在信用證的業(yè)務流程中,單證審核員都要對單據(jù)進行人工審核。由于單證都為英文、且專業(yè)性很強,所以對單證審核員要求較高,導致單證中心運營成本較高;
經(jīng)驗要求高:業(yè)務方面的人才培養(yǎng)周期長,對于業(yè)務不熟練的新手不但審單效率更低,而且難免會出現(xiàn)各種錯誤,需要有經(jīng)驗的審單員協(xié)助與復查。
效率低:在單據(jù)方面由于種類較多,審核過程復雜,所以一個訓練有素的單證審核人員一天也只能處理幾筆業(yè)務,效率低下;
工作壓力大:單證業(yè)務中心作為單證的集中處理中心,日常工作量大,同時由于審核流程較復雜等諸多原因,導致工作人員日常工作壓力大。
面對業(yè)務中的痛點需求,某大型國有銀行選擇與一覽群智進行合作,基于知識圖譜等人工智能技術,共同打造智能審單專家系統(tǒng)。

一覽群智以自然語言處理和知識圖譜等認知智能技術為基礎,為客戶提供一站式AI產品和行業(yè)解決方案,滿足企業(yè)在超大規(guī)模多源異構情況下的數(shù)據(jù)治理融合、不同場景下的AI建模和復雜決策分析需求。
一覽群智打造的智能審核專家系統(tǒng)通過ICR識別票據(jù)并結構化業(yè)務信息;通過機器學習和自然語言處理進行業(yè)務分類并理解其含義;利用知識圖譜構建自動審核引擎。系統(tǒng)具備完整的功能及流程。
在實際的業(yè)務場景中,將領域知識庫與實際業(yè)務相結合,可以有效的降低業(yè)務的上手難度,提高工作效率,同時將工作人員在重復的勞動中解放。
某大型國有銀行與一覽群智進行合作構建的智能審單專家系統(tǒng)優(yōu)勢體現(xiàn)為:
業(yè)務系統(tǒng)信息自動填寫:系統(tǒng)將自動識別業(yè)務信息并在業(yè)務系統(tǒng)填寫,免除人工操作;
智能預審+多層級人機協(xié)同機制:機器自動給出單據(jù)及業(yè)務不符點和免查點,大幅提升人員效率,減輕審單壓力;
創(chuàng)新的審核知識圖譜構架:發(fā)揚圖譜可視化、強關系表示的優(yōu)點,全面理解并監(jiān)控審核動作;
線下工作轉線上:將原本線下的審核工作轉移到系統(tǒng)中進行約束,統(tǒng)一審核標準,保證審核質量,加強合規(guī)性管理;
數(shù)據(jù)資產增值:將原本無法存留的發(fā)票信息、合同信息等進行結構化,通過挖掘數(shù)據(jù)價值,為營銷/運營/風控等領域提供決策支撐。
3.2能源與工業(yè)行業(yè)最佳實踐案例
能源與工業(yè)行業(yè)領域知識庫最佳實踐案例
作為勞動密集型企業(yè),能源企業(yè)吸收大量勞動資源,但能源行業(yè)業(yè)務復雜,諸多環(huán)節(jié)積累大量知識,面臨知識難以積累、人員培訓難度大等痛點。能源企業(yè)需要快速建立領域知識庫;同時,面對能源行業(yè)的業(yè)務挑戰(zhàn),企業(yè)需求將數(shù)據(jù)形成知識,創(chuàng)建支持上層業(yè)務應用的領域知識庫,在輔助業(yè)務應用的同時進行相應的知識積累。員工可通過知識庫快速獲取知識,降低培訓與研發(fā)成本;利用知識圖譜技術,企業(yè)可打通底層數(shù)據(jù),將行業(yè)知識整合,建立領域知識庫,形成企業(yè)知識中臺,賦能上層業(yè)務應用。
知識圖譜技術目前已在能源與工業(yè)行業(yè)領域知識庫的業(yè)務場景有成功應用。在幫助能源與工業(yè)企業(yè)構建知識圖譜的過程中,知識圖譜廠商應具備以下能力:
能源與工業(yè)行業(yè)具有海量數(shù)據(jù),需要廠商具備大規(guī)模知識圖譜構建能力;
能源與工業(yè)行業(yè)模型計算復雜度較高,需要廠商在行業(yè)內有一定模型積累;
企業(yè)針對生產與加工流程等場景構造與業(yè)務相關的復雜關系網(wǎng)絡時,需要知識圖譜廠商具備較強技術能力以及具有一定行業(yè)知識積累;
由于能源行業(yè)發(fā)展時間較早,系統(tǒng)部署情況復雜,要求廠商的知識圖譜平臺應具備較好的兼容性,能夠快速完成平臺對接工作。
明略科技助力國內某省電力數(shù)據(jù)中臺創(chuàng)新應用
國網(wǎng)某省電力公司,是國家電網(wǎng)有限公司的全資子公司,擔負某省電力供應的重大責任。公司積極開展智能電網(wǎng)建設,將人工智能與大數(shù)據(jù)技術賦能實際業(yè)務場景。
智能電網(wǎng)建設是智慧城市建設的重要組成部分,但由于電力行業(yè)屬性較強,在數(shù)字化以及智能化轉型的過程中,在數(shù)據(jù)層面存在諸多問題:
各部門形成數(shù)據(jù)孤島,在應用建設過程中難以進行有效的數(shù)據(jù)互聯(lián);
各部門數(shù)據(jù)無統(tǒng)一數(shù)據(jù)標準,包括用戶數(shù)據(jù)、營銷部門和設備部門數(shù)據(jù),存在數(shù)據(jù)收集困難和分類不統(tǒng)一等問題;
各部門數(shù)據(jù)對接存在不對應問題:如用戶數(shù)據(jù)和設備需要對接,但會存在數(shù)據(jù)和設備不對應問題;
電力行業(yè)作為技術密集型行業(yè),在各環(huán)節(jié)存在大量知識,需要有效途徑對各場景內知識進行管理;
海量復雜數(shù)據(jù)情況下,數(shù)據(jù)實時性、數(shù)據(jù)打通以及更便捷地提取數(shù)據(jù)就會成為問題。
針對諸多的業(yè)務挑戰(zhàn),國網(wǎng)某省電力公司與明略科技合作建立統(tǒng)一的數(shù)據(jù)中臺,先做好數(shù)據(jù)治理與關聯(lián)工作,再將數(shù)據(jù)中臺的成果服務于業(yè)務應用環(huán)節(jié)。
明略科技是中國領先的數(shù)據(jù)中臺和企業(yè)智能決策平臺提供商,致力于通過大數(shù)據(jù)分析挖掘和認知智能技術,推動知識和管理復雜度高的大中型企業(yè)進行數(shù)字化轉型。
國網(wǎng)某省電力公司與明略科技對數(shù)據(jù)中臺項目進行有效的拆解,進行“三步走”戰(zhàn)略:
第一步,完成基于數(shù)倉的基本模型建立;
第二步,初步實現(xiàn)數(shù)據(jù)中臺與主要業(yè)務系統(tǒng)的系統(tǒng)對接、數(shù)據(jù)共享與數(shù)據(jù)服務,同時探索在某些業(yè)務場景(設備故障知識圖譜、配網(wǎng)調度機器人)等領域進行業(yè)務應用建設;
第三步,完成數(shù)據(jù)中臺建設,實現(xiàn)公司整體的數(shù)據(jù)管理、數(shù)據(jù)分析與數(shù)據(jù)分享。
國網(wǎng)某省電力公司數(shù)據(jù)中臺的建設核心主要體現(xiàn)在七大方面:數(shù)據(jù)匯聚、數(shù)據(jù)加工處理、數(shù)據(jù)治理管控、數(shù)據(jù)存儲、數(shù)據(jù)分析、數(shù)據(jù)共享與數(shù)據(jù)應用。國網(wǎng)某省電力公司在構建中臺的過程中,先實現(xiàn)數(shù)據(jù)中臺基礎能力,搭建整個企業(yè)的設備知識與業(yè)務模型中心。在搭建完中臺能力后,在此基礎上進行業(yè)務應用開發(fā),循序漸進地推動項目向前。數(shù)據(jù)中臺架構如下圖所示:

國網(wǎng)某省電力公司與明略科技合作搭建的數(shù)據(jù)中臺價值體現(xiàn)在四個方面:
數(shù)據(jù)匯聚層面:基于數(shù)據(jù)中臺的搭建,實現(xiàn)線上數(shù)據(jù)實時采集、線下數(shù)據(jù)上傳及導入,并監(jiān)控、優(yōu)化數(shù)據(jù)流轉與工作鏈路;其中,針對電網(wǎng)類數(shù)據(jù),完成生產管理、電力調度管理等15套業(yè)務系統(tǒng)數(shù)據(jù)采集;針對營銷類數(shù)據(jù),營銷業(yè)務應用、用電信息采集等20套業(yè)務系統(tǒng)數(shù)據(jù)采集;針對經(jīng)營類數(shù)據(jù),完成財務管控、規(guī)劃計劃、電網(wǎng)建設、全員績效、員工報銷等118套業(yè)務系統(tǒng)數(shù)據(jù)采集;
核心資源標準庫層面:結合CIM模型與維度建模方法,基于9大數(shù)據(jù)域(人員域、財務域、物資域、客戶域、設備域、供應商域、項目域、合同域、公共域)完成企業(yè)級數(shù)據(jù)倉庫建設,建立數(shù)據(jù)資源目錄,形成數(shù)據(jù)共享能力;
數(shù)據(jù)共享層面:基于核心資源標準庫,向下屬地市公司和科研單位,高質量共享數(shù)據(jù)資源,支撐各類業(yè)務快速構建、敏捷創(chuàng)新;
數(shù)據(jù)應用層面:基于數(shù)據(jù)中臺,完成設備故障知識圖譜、配網(wǎng)調度機器人等應用建設,并繼續(xù)探索在實際業(yè)務場景中的應用。在基于故障知識圖譜的維修助手場景中,明略科 技幫助客戶將故障信息搜索匯總時間從10分鐘降低到1分鐘內,且能實現(xiàn)遠程技術支持。
同時,在項目的構建過程中,國網(wǎng)某省電力公司與明略科技積極配合,總結兩點關鍵成功要素,對其他用戶有一定的參考價值:
由于電力行業(yè)的特殊性,其他行業(yè)知識圖譜廠商或者大數(shù)據(jù)廠商難以在電力行業(yè)有效地復制其他行業(yè)的成功案例。甲方用戶在考察廠商時,應注重廠商在電力行業(yè)的案例背書和復雜電力數(shù)據(jù)場景下的治理、分析能力;
電力行業(yè)知識圖譜以及數(shù)據(jù)中臺的建設難以一蹴而就,需要較長期的投入,在項目進行之前,需對各階段項目目標進行合理預期。
3.3醫(yī)療與醫(yī)藥行業(yè)最佳實踐案例
醫(yī)院智能導診最佳實踐案例
患者去醫(yī)院就診時,經(jīng)常會遇到“知癥不知病”、“知病不知科”的問題,現(xiàn)有的導診方式一般為人工導診或基于關鍵詞的導診系統(tǒng),導診的效率和效果有待提升;智能導診雖然是診療過程中的一個輔助環(huán)節(jié),但對強化醫(yī)院內部管理、協(xié)調醫(yī)療資源、提升患者就醫(yī)體驗、提高醫(yī)療質量,具有明顯的優(yōu)化作用;為患者提供精準的智能導診服務,不僅可以為患者快速找到合適的科室和合適的醫(yī)生,減少患者就診時間,同時可以緩解醫(yī)務人員工作壓力、促進醫(yī)療資源合理配置;
知識圖譜技術目前已在智能導診的業(yè)務場景有成功應用。在幫助醫(yī)院構建知識圖譜的過程中,知識圖譜廠商應具備以下能力:
醫(yī)療是典型以多源異構數(shù)據(jù)為主的行業(yè),數(shù)據(jù)融合在醫(yī)療應用場景中更加復雜,需要廠商具備較強的數(shù)據(jù)治理能力;
醫(yī)院對智能導診系統(tǒng)的疾病判斷準確率、醫(yī)生推薦準確率和體驗度的要求較高,要求廠商不但技術實力強,在醫(yī)療領域know-how的積累更加重要;
各個醫(yī)院科室劃分、職能劃分和醫(yī)生資源分布情況不同,要求廠商的定制化能力較強,具備良好的服務意識。
基于知識圖譜,深睿醫(yī)療創(chuàng)新“肝膽胰睿助” 智能問診服務
中國人民解放軍總醫(yī)院是一家集醫(yī)療、保健、教學、科研為一體的大型三甲醫(yī)院,日接待患者量巨大,醫(yī)護人員工作繁忙。
中國人民解放軍總醫(yī)院肝膽胰腫瘤外科包括肝膽病區(qū)和胰腺病區(qū),是以肝膽胰腫瘤的診斷、手術治療和科研為主要方向的科室。肝膽胰腫瘤外科作為醫(yī)院重要的科室,具有日常問診量大、手術量大、復診量大,同時部分患者長期住院接受治療等特點,導致肝膽胰腫瘤外科醫(yī)護人員工作壓力較大。
深睿醫(yī)療聯(lián)合鵬城實驗室、解放軍總醫(yī)院劉榮主任、哈爾濱工業(yè)大學、北京大學、道子科技、云孚科技等機構共同推出“肝膽胰睿助”(簡稱:小睿)產品?;诤A繑?shù)據(jù)、構建醫(yī)療知識圖譜,為醫(yī)生和患者提供覆蓋診前、診中、診后的數(shù)字化、智能化服務,旨在有效降低醫(yī)護人員工作壓力,提高診斷效率,同時為患者提供疾病知識,讓患者了解相關病情。
深睿醫(yī)療通過計算機視覺、知識圖譜等AI技術以及自主研發(fā)的核心算法,為國內外醫(yī)療服務機構提供基于人工智能和互聯(lián)網(wǎng)醫(yī)療的解決方案。

實際使用過程中,患者掃描報到機旁的二維碼,打開小程序“肝膽胰睿助”,通過一問一答的人機對話,完成自己病情的陳述,“肝膽胰睿助”則根據(jù)人機對話生成電子病歷,以便醫(yī)生查看。患者離開診室后,還能向這位“肝膽胰睿助”咨詢疾病問題。
“肝膽胰睿助” 基于海量的數(shù)據(jù)、構建醫(yī)療知識圖譜,結合人工智能技術,建立虛擬醫(yī)生問診模型,根據(jù)患者癥狀進行鑒別問診追問,最終生成一份符合門診病歷要求的病情總結,將醫(yī)生從撰寫病歷的時間解脫出來,從而與病患進行更為深入的病情溝通,整體提升問診效率及質量。
“肝膽胰睿助”在研發(fā)階段收集互聯(lián)網(wǎng)肝膽胰腫瘤患者數(shù)十萬的提問,整理出患者最關心的問題,利用哈爾濱工業(yè)大學的語言技術平臺LTP和大詞林等技術將問題進行聚類,形成相關問題簇,最終交由中國人民解放軍總醫(yī)院肝膽胰腫瘤外科劉榮主任團隊進行編輯對應回答,耗時2個月,從而達到95%問題覆蓋率,從而保證了患者能搜其想看,并且保證能回答的準確性。

中國人民解放軍總醫(yī)院肝膽胰腫瘤外科應用“肝膽胰睿助”的價值主要體現(xiàn)在以下三大方面:
提高問診效率,在患者候診時進行鑒別問診,有效減少醫(yī)生撰寫病歷時間;
“肝膽胰睿助”支持患者答疑,解決患者問診后咨詢難的問題。同時,提供患者更多醫(yī)學知識,包括解答術前、術后、不良反應等問題,加深患者病情了解,降低患者恐懼感,提高患者依從性;
支持隨訪功能,醫(yī)生了解患者健康情況,同時患者向醫(yī)生報告身體狀況的可疑變化,及時防范病癥復發(fā)。
3.4政府與公共服務行業(yè)最佳實踐案例
公安行業(yè)最佳實踐案例
目前公安行業(yè)的智能化應用主要停留在感知智能,強調前端數(shù)據(jù)的采集以及后端視頻解析能力,認知智能的應用推廣有限,導致公安數(shù)據(jù)信息規(guī)模龐大、數(shù)據(jù)復雜。辦案人員需要將海量數(shù)據(jù)快速抽取成知識,發(fā)現(xiàn)有用信息;違法犯罪活動本身具備隱蔽性、團伙性等特征,在技術高速發(fā)展的背景下,又呈現(xiàn)出網(wǎng)絡化、智能化、復雜化等新特征,增加了公安人員的辦案難度。面對當前的公安業(yè)務新挑戰(zhàn),公安部門推動公安系統(tǒng)智能化改造,打破系統(tǒng)原有信息孤島,挖掘潛在隱藏信息,分析關聯(lián)關系,形成知識網(wǎng)絡,通過技術手段支撐“人、事、地、物、組織”等刑偵關鍵要素。
知識圖譜技術已應用在公安領域,通過知識圖譜技術搭建公安領域知識圖譜,針對多業(yè)務場景,實現(xiàn)重點人員關聯(lián)分析、異常事件挖掘、重點場所關聯(lián)分析、物品關聯(lián)分析、團伙關系分析、相似案件推理等一系列智能輔助功能,提高公安機關辦案效率。在幫助公安行業(yè)構建知識圖譜的過程中,知識圖譜廠商應具備以下能力:
公安機關具有海量數(shù)據(jù),需要廠商具備大規(guī)模知識圖譜構建能力;
各地公安機關具備自身特點,在構建知識圖譜的過程中,需要較多定制化服務,要求廠商定制化能力較強,具備較好的服務意識;
公安實戰(zhàn)經(jīng)驗需要轉換為公安知識圖譜中的應用模型,需要廠商具備一定公安行業(yè)模型積累;
公安領域內對于知識檢索有一定需求,要求廠商具備一定自然語言處理能力;
公安領域存在大量的非結構化、半結構化信息,廠商在構建知識圖譜的過程中需要較強的數(shù)據(jù)治理能力。
百分點助力某市政府構建治安防控大數(shù)據(jù)分析研判平臺
某市地理位置特殊,多山且與港口城市接壤,是電信詐騙、跨境網(wǎng)絡賭博等案件高發(fā)的城市。該市公安局下轄200多個派出所,希望能在網(wǎng)絡詐騙專項治理行動中,使用新技術、新思路,解決當?shù)鼐W(wǎng)絡詐騙、網(wǎng)絡賭博等案件的發(fā)現(xiàn)難、取證難、抓補難等問題。
隨著信息技術的快速發(fā)展,社會信息化程度的不斷加深,犯罪活動呈現(xiàn)出復雜化、動態(tài)化、智能化的特征。如何利用大數(shù)據(jù)、人工智能等先進技術,分析數(shù)字世界并發(fā)現(xiàn)犯罪線索,實現(xiàn)對犯罪行為的早發(fā)現(xiàn)、早識別、早打擊,已成為公安業(yè)務系統(tǒng)構建中最為核心的挑戰(zhàn)。
尤其在疫情后,該市電信網(wǎng)絡詐騙案頻發(fā),想通過貸款、兼職來獲取資金的群眾增多,犯罪分子利用這一點瘋狂作案。該市公安機關迫切需要利用大數(shù)據(jù)與人工智能等新一代信息技術,對海量的多源異構數(shù)據(jù)進行整合治理,并深度結合當?shù)貥I(yè)務場景和歷史辦案經(jīng)驗構建數(shù)據(jù)模型,有效提升該市的案件處置能力與公安綜合防控水平。
百分點是中國領先的數(shù)據(jù)智能技術企業(yè),在數(shù)字政府領域構建了完善的技術產品和解決方案體系,擁有豐富的海外國家級和國內省市級數(shù)字政府建設經(jīng)驗。
針對該市業(yè)務特點,該市政府與百分點構建了一體化的大數(shù)據(jù)綜合分析平臺,利用動態(tài)知識圖譜等技術,將公安的人、地、事、物、組織、虛擬標識等要素按照實體、事件及其之間的關系進行數(shù)據(jù)融合匯聚治理,打破原有治安業(yè)務系統(tǒng)數(shù)據(jù)壁壘,提升治安數(shù)據(jù)融合治理、分析研判、智能應用和風險防控能力。
同時,該市政府與百分點構建了分析研判平臺、戰(zhàn)法模型平臺、融合動態(tài)管控三個數(shù)據(jù)分析應用體系,實現(xiàn)社會治安風險的提前防范、精準打擊和動態(tài)管控。治安防控大數(shù)據(jù)分析研判平臺將知識圖譜、NLP、戰(zhàn)法模型等技術融入到治安綜合平臺建設中?;跀?shù)據(jù)資源統(tǒng)一服務平臺,對治安信息進行全面整合、深度挖掘和研判分析,建立多種服務為上層各類治安業(yè)務應用提供支撐。

治安防控大數(shù)據(jù)分析研判平臺解決方案的核心要素主要體現(xiàn)在以下四個方面:
公安大數(shù)據(jù)融合治理:利用百分點公安大數(shù)據(jù)治理平臺,高效整合集成了當?shù)亟兕悢?shù)據(jù)資源、幾十億條數(shù)據(jù),并依托“動態(tài)知識圖譜”技術,對每天新增千萬條數(shù)據(jù)進行動態(tài)融合,實現(xiàn)對當?shù)毓踩財?shù)據(jù)的高效整合治理;
多維度綜合分析研判電信詐騙事件:針對電信網(wǎng)絡詐騙已有線索,通過聯(lián)合搜素、事件查詢、全息檔案、關聯(lián)分析、軌跡分析等多維分析功能,對文本、圖片的檢索分析,以及信息搜索,快速實現(xiàn)對線索的分析研判,展示線索的全貌;
結合實際業(yè)務構建預警戰(zhàn)法模型:圍繞“掃黃打非”專項業(yè)務流程,通過平臺自定義算法,進行模型開發(fā)、模型分析,為用戶提供低門檻、靈活易用的模型應用體驗,深度挖掘潛在關聯(lián)關系,快速發(fā)現(xiàn)高價值線索;
融合動態(tài)管控:境外賭場在國內發(fā)展大力代理機構,以“免費旅游、無息貸款“的幌子拉攏國內人員到東南亞國家或澳門賭場賭博。針對當?shù)刂伟簿S穩(wěn)、風險防控、偵查破案等實戰(zhàn)需求,基于動態(tài)知識圖譜,對各類軌跡信息進行實時接入和融合拉通,實現(xiàn)對人、車、物等重點目標的多維分析和智能管控。
該市政府與百分點構建的治安防控大數(shù)據(jù)分析研判平臺的價值主要體現(xiàn)在以下三個方面:
覆蓋全市200余個派出所,通過對潛在風險的主動感知預警,減輕了民警工作量,主動化解社會風險。打造了從案件線索發(fā)現(xiàn)、分析研判、偵查打擊到風險預警的數(shù)字化偵查模式,對多起網(wǎng)絡詐騙違法犯罪活動及可疑團伙準確識別和打擊;
充分利用大數(shù)據(jù)、人工智能等信息技術將海量公安數(shù)據(jù)做融合治理,并結合資深干警的破案經(jīng)驗并沉淀為數(shù)據(jù)模型,打造了研判分析智慧大腦,使新任警員也能夠快速獲取經(jīng)驗知識,高效提升了辦案業(yè)務能力和處置效率;
通過多維數(shù)據(jù)融合優(yōu)化分析、碰撞關聯(lián),實現(xiàn)了一個窗口查詢、各警種綜合應用、多維度分級管控、預警信息主動推送和扁平化指揮調度,成功破獲危害國家及群眾財產安全的跨境網(wǎng)絡賭博案件。

4.知識圖譜未來展望
4.1 新機會:感知智能向認知智能時代跨進,知識圖譜將駛向快車道
4.1.1感知智能定義
感知智能是指將物理世界的數(shù)據(jù)通過攝像頭、麥克風或者其他傳感器等方式進行采集,借助語音識別、圖像識別等技術,映射到數(shù)字世界,并做標準化、結構化處理,一方面實現(xiàn)在特定場景的應用落地;另一方面可將數(shù)據(jù)提升至可認知的層次,即將信息翻譯成及人類可理解、并用于分析和決策的數(shù)據(jù),為認知智能提供數(shù)據(jù)基礎。

4.1.2知識圖譜是認知智能關鍵技術
人工智能分為感知智能、認知智能和行動智能三個階段。當前正處于認知智能的起步階段。
從感知智能到認知智能,知識圖譜是關鍵一步。
認知智能是感知智能的進階,需要在感知智能的基礎上,結合行業(yè)知識,理解數(shù)據(jù)之間的邏輯關系以及代表的業(yè)務意義,并在此基礎上進行分析決策。
感知智能階段,更強調人工智能在信息獲取上的應用創(chuàng)新,如計算機視覺領域的人臉識別算法應用。但隨著人工智能與大數(shù)據(jù)技術的不斷深化演進,業(yè)務場景數(shù)字化需求不斷深化,同時大量無關聯(lián)的數(shù)據(jù)使得管理變復雜,不利于用戶數(shù)據(jù)管控,“數(shù)據(jù)孤島”問題凸顯。
核心問題在于,感知智能如同四肢,而認知智能如同大腦,忽略后端平臺即“大腦”對于信息的知識抽取和與業(yè)務場景的關聯(lián)分析,導致人工智能技術在推進過程中出現(xiàn)“四肢發(fā)達、頭腦簡單”的現(xiàn)象。
認知智能時代的到來,是在感知智能之上,提高了AI的理解分析能力。知識圖譜技術將起到重要的支撐作用。在認知智能階段,機器能夠通過知識圖譜挖掘隱性關系,洞察“肉眼”無法發(fā)現(xiàn)的關系和邏輯,用于最終的業(yè)務決策,注重行業(yè)知識圖譜和關系挖掘,是人工智能在行業(yè)中更深層的落地應用。
認知智能時代剛剛起步,只有部分數(shù)字化水平較高的行業(yè),如金融、政務、公安等行業(yè)開始逐步落地知識圖譜應用場景,更多的行業(yè)還在探索階段。
4.1.3認知智能時代,知識圖譜將高速發(fā)展
認知智能時代的到來將推動知識圖譜技術高速發(fā)展。
人工智能各時代之間是包含關系,而非取代關系,隨著感知智能技術的發(fā)展,認知智能技術也會不斷發(fā)展,海量數(shù)據(jù)的有效管理的問題會一直存在,知識圖譜是目前平衡數(shù)據(jù)與管控最有效的解決方案,不斷發(fā)展的知識圖譜技術將為數(shù)據(jù)提供更加有效的分析管理應用;
目前,認知智能發(fā)展至今,在落地應用過程中存在兩大核心難點,即海量數(shù)據(jù)治理與關聯(lián)關系挖掘。其中海量數(shù)據(jù)的治理工作將主要由數(shù)據(jù)中臺完成。關聯(lián)關系挖掘目前將主要依靠知識圖譜技術進行。由于知識圖譜技術本身的優(yōu)勢,可以實現(xiàn)數(shù)據(jù)間隱性關系識別,同時目前學界正在攻關的跨知識庫關聯(lián)關系分析,也將有利于未來認知智能時代,具有復合知識能力的人工智能技術的研發(fā)。認知智能時代將更加依賴知識圖譜。
認知智能相較于感知智能時代的一大特點為計算機的推理判斷能力,將有效數(shù)據(jù)與相關結論關聯(lián),形成有效判斷。輔助操作者決策類的應用將在未來的認知智能時代有廣泛應用,而作為構建此類應用的底層技術,知識圖譜也將高速發(fā)展。
4.2 新場景:知識圖譜將在垂直領域誕生更多應用場景
知識圖譜技術未來在垂直領域應用主要有兩個方向:1)目前已有應用的行業(yè)將拓展應用場景與應用領域;2)未有知識圖譜應用的行業(yè)將學習相似行業(yè)的成功經(jīng)驗復制應用。
針對目前已有應用的行業(yè),知識圖譜技術將通過關聯(lián)分析、語義識別、智能搜索、推理決策、知識庫管理等諸多應用功能與用戶需求發(fā)生 “碰撞”,產生新的應用場景。同時,行業(yè)內知識圖譜的整體搭建速度也會更快,成熟度更高,搭建成本降低,在此行業(yè)知識圖譜技術已廣泛應用時,將會出現(xiàn)功能完整的通用性知識圖譜產品,知識圖譜產品將向普惠方向發(fā)展,賦能行業(yè)內中小用戶;
針對目前未有知識圖譜應用的行業(yè),主要原因有三點:1)行業(yè)內數(shù)據(jù)整體水平參差不齊,行業(yè)數(shù)字化進程較慢;2)勞動密集型產業(yè),行業(yè)知識積累與管理對于行業(yè)整體影響較小;3)整體行業(yè)經(jīng)濟不景氣,對于數(shù)字化投資有限,無專項資金支撐知識圖譜構建;
針對此類行業(yè),隨著行業(yè)數(shù)字化轉型的加快,未有知識圖譜應用的行業(yè)將學習相似行業(yè)知識圖譜產品的成功案例,復制到本行業(yè)中。但應注意,知識圖譜技術有較強的領域性,在項目實施過程中需要行業(yè)用戶與廠商共同探索在新行業(yè)內的知識圖譜技術應用。
4.3 新融合:多技術融合將成為未來主流趨勢
知識圖譜本身是一種語義網(wǎng)絡,屬于泛自然語言處理技術,發(fā)展至今,知識圖譜與NLP技術有千絲萬縷的聯(lián)系。同時,在未來認知智能,乃至行動智能的時代,人工智能技術的協(xié)同融合趨勢將更加明顯。
由于知識圖譜的結構特殊性,隨著數(shù)據(jù)量的增大,目前知識圖譜的跨庫應用能力較弱,對知識圖譜進行分布式存儲將成為重要研究方向。未來分布式的知識圖譜存儲結構將有效地解決知識圖譜負載與存儲模型的問題,更好地應對未來更大數(shù)據(jù)量的知識圖譜構建。
機器學習等人工智能技術與知識圖譜技術也會在知識構建、知識推理、知識存儲以及知識應用等多方面有更加深入的結合。算法模型將更好地支持全流程的知識圖譜構建。
結語
各行業(yè)領域用戶都摩拳擦掌,準備利用知識圖譜技術“武裝”自身業(yè)務。但知識圖譜技術在垂直領域的未來之路還有很長,每一項技術的發(fā)展都是螺旋遞進。目前知識圖譜只是在部分信息化較好的行業(yè)有良好應用,更多的應用場景需要廠商與用戶共同探索。
知識圖譜是感知智能向認知智能飛躍的關鍵技術。沒有一項技術是完美的,所以,技術融合的趨勢會讓各項技術取長補短,更好服務于知識圖譜的應用。技術融合也將是未來趨勢。
目前國內已經(jīng)涌現(xiàn)出一批知識圖譜的優(yōu)秀廠商,克服萬難,在各擅長的領域內完成知識圖譜的落地應用。“寶劍鋒從磨礪出,梅花香自苦寒來”,知識圖譜就是一個在應用中不斷打磨進化的技術,各家廠商也應做好深耕行業(yè),沉淀積累的準備。
知識圖譜更像是一個工程而非單一的技術。知識圖譜要做到的是落地應用而非紙上談兵。在未來,相信知識圖譜會賦能更多的應用場景。
特別提醒:本網(wǎng)內容轉載自其他媒體,目的在于傳遞更多信息,并不代表本網(wǎng)贊同其觀點。其原創(chuàng)性以及文中陳述文字和內容未經(jīng)本站證實,對本文以及其中全部或者部分內容、文字的真實性、完整性、及時性本站不作任何保證或承諾,并請自行核實相關內容。本站不承擔此類作品侵權行為的直接責任及連帶責任。如若本網(wǎng)有任何內容侵犯您的權益,請及時聯(lián)系我們,本站將會在24小時內處理完畢。