隨著移動互聯(lián)網(wǎng)的發(fā)展,萬物互聯(lián)帶來數(shù)據(jù)爆發(fā)式地增長,這些數(shù)據(jù)恰好可以作為分析實體間關(guān)系的有效原料。以往的智能分析專注在每一個個體上,在移動互聯(lián)網(wǎng)時代,這種個體之間的關(guān)系也必然成為我們需要深入分析的重要部分。 在實際應(yīng)用場景中,只要有關(guān)系分析的需求,知識圖譜就“有可能”派的上用場。
知識圖譜將通過發(fā)掘?qū)嶓w之間的關(guān)聯(lián),將半結(jié)構(gòu)化、非結(jié)構(gòu)化的數(shù)據(jù)整合,幫助我們理解數(shù)據(jù)、解釋現(xiàn)象、知識推理,從而發(fā)掘深層關(guān)系、實現(xiàn)智慧搜索與智能交互。
文思海輝·金融基于知識圖譜技術(shù),分別在語義搜索、智能問答、視覺理解、數(shù)據(jù)分析等方面做過深度的探索?;谥R圖譜,機器獲取到的不再是無關(guān)聯(lián)的信息,而是可以把這些信息映射到各種各樣的實體、概念,從而建立機器自己的認(rèn)知世界。在知識圖譜的探索過程中,我們將逐步解決數(shù)據(jù)結(jié)構(gòu)、數(shù)據(jù)質(zhì)量以及核心算法的問題。
知識圖譜的實現(xiàn)
其中,我們主要探索的核心圖譜包括:
- l引文分析:基于論文之間的引用與被引用關(guān)系開展分析,并可以進一步延伸,分析與論文相關(guān)的作者、機構(gòu)、期刊等多種對象。
- l詞頻分析:利用能代表文獻核心內(nèi)容的主題詞在某領(lǐng)域中出現(xiàn)的頻次高低來確定該領(lǐng)域研究熱點和發(fā)展動向。
- l共詞分析:統(tǒng)計文件中共同出現(xiàn)的關(guān)鍵詞對,進而分析這些詞對所代表的學(xué)科和主題的結(jié)構(gòu)變化。
- l多元統(tǒng)計分析:對若干可能相關(guān)的隨機變量的觀測值的分析。
- l社會網(wǎng)絡(luò)分析:社會學(xué)研究方法,通過分析網(wǎng)絡(luò)中的關(guān)系探討網(wǎng)絡(luò)的結(jié)構(gòu)及屬性特征
- l多重共現(xiàn)分析:對于多個不同類型的信息(字段),借助它們之間的共同出現(xiàn)考察關(guān)聯(lián)關(guān)系。
新數(shù)據(jù)和新算法為規(guī)?;R圖譜構(gòu)建提供了新的技術(shù)基礎(chǔ)和發(fā)展條件,使得知識圖譜構(gòu)建的來源、方法和技術(shù)手段都發(fā)生極大的變化。知識圖譜作為知識的一種形式,尤其在金融領(lǐng)域中,數(shù)據(jù)可視化、風(fēng)險評估、反欺詐、風(fēng)險預(yù)測、用戶洞察等各類業(yè)務(wù)場景上,知識圖譜作為底層基礎(chǔ)性技術(shù)的支撐作用越來越顯著?;谥R圖譜技術(shù),文思海輝·金融分別在客戶的關(guān)系網(wǎng)絡(luò)、擔(dān)保網(wǎng)絡(luò)等得到非常好的應(yīng)用,也為商業(yè)銀行提供了較強的決策支持。
隨著應(yīng)用場景和技術(shù)生態(tài)的變化,整個知識圖譜的應(yīng)用也面臨著全新的挑戰(zhàn)。
從技術(shù)角度來講,通過一系列的實踐證明,簡單的優(yōu)于強大的,太過復(fù)雜的比如 OWL 最終用不起來,反而比較簡單的像 RDF以及最近比較火的 JSON-LD 用得越來越多,后續(xù)文思海輝·金融會在更多的項目中不斷完善。
從應(yīng)用的角度來講,知識圖譜的應(yīng)用趨勢越來越從通用領(lǐng)域走向行業(yè)領(lǐng)域。
未來,文思海輝·金融將在智能風(fēng)控、反欺詐、智能營銷、智能催收、智能投顧等方面做更深入的知識探究。