公司舊電腦到期,換了一臺電腦的原因之前爬取的數(shù)據(jù)全部忘了備份,全部弄丟了。所以這個項目好久沒開工了。
本文需要進一步研究知識圖譜的數(shù)據(jù)存儲。由于知識圖譜的圖結(jié)構特點,使用傳統(tǒng)的關系型數(shù)據(jù)庫存儲大量的關系表,在做查詢的時候需要大量的表連接,速度非常慢,所以往往知識圖譜采用的是圖數(shù)據(jù)庫。
一、圖數(shù)據(jù)庫和關系型數(shù)據(jù)庫的差別
還是以NBA里的數(shù)據(jù)為例,為了表示球員和球隊的效力關系,關系型數(shù)據(jù)庫需要增加一張球員和球隊關系表來存儲這個關系。如下圖:

而圖數(shù)據(jù)庫通過引入“效力于”關系邊的概念來加以解決。不需要建表,關系邊上可以存儲屬性,比如效力時間這一字段。

工作中我們團隊的知識圖譜是存儲在阿里自研的圖數(shù)據(jù)庫上,鑒于數(shù)據(jù)安全問題,在這個項目里我采用了比較流行的neo4j圖數(shù)據(jù)庫。
二、Neo4J的使用
neo4j的使用,主要參考了官方文檔https://neo4j.com/docs/developer-manual/current/drivers/client-applications/。Neo4J設計了一種叫做Cypher的查詢語言,語法非常奇怪。官方提供的一個二跳的查詢例子,查詢John的朋友的朋友:


2rows
我嘗試創(chuàng)建了一個NBA的DB,用create語句創(chuàng)建了NBA火箭隊、保羅和哈登三個實體。創(chuàng)建語句如下

創(chuàng)建了2個球員實體,包括了身高/體重/生日/合同情況,創(chuàng)建了一個球隊實體,包括了球館、城市等信息,創(chuàng)建了兩條球員和球隊的關系邊,每條邊上定義球員在該球隊效力時間??梢暬Y(jié)果如下圖:

OK,至此一個小的知識圖譜就在圖數(shù)據(jù)庫里被創(chuàng)建完畢了,后續(xù)要做的是把大規(guī)模數(shù)據(jù)導入圖數(shù)據(jù)庫
-
數(shù)據(jù)存儲
+關注
關注
5文章
1025瀏覽量
52944 -
數(shù)據(jù)庫
+關注
關注
7文章
4020瀏覽量
68349 -
知識圖譜
+關注
關注
2文章
132瀏覽量
8315
原文標題:干貨篇 || PCB設計中眼圖到底有什么用?
文章出處:【微信號:FANYPCB,微信公眾號:凡億PCB】歡迎添加關注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
NLPIR系統(tǒng)KGB知識圖譜技術助力大數(shù)據(jù)深度挖掘
NLPIR大數(shù)據(jù)知識圖譜完美展現(xiàn)文本數(shù)據(jù)內(nèi)容
KGB知識圖譜基于傳統(tǒng)知識工程的突破分析
KGB知識圖譜技術能夠解決哪些行業(yè)痛點?
知識圖譜的三種特性評析
KGB知識圖譜通過智能搜索提升金融行業(yè)分析能力
如何使用知識圖譜對圖像語義進行分析技術及應用研究
一文帶你讀懂知識圖譜
知識圖譜劃分的相關算法及研究
知識圖譜在工程應用中的關鍵技術、應用及案例
通用知識圖譜構建技術的應用及發(fā)展趨勢
知識圖譜Knowledge Graph構建與應用
知識圖譜:知識圖譜的典型應用
知識圖譜的數(shù)據(jù)存儲技術研究
評論