上期的公眾號小編帶著大家了解了什么是圖數據庫以及圖數據庫應用的十大領域。本期文章小編和大家分享下:
一、當前數據面臨的趨勢與挑戰
二、知識圖譜的類別有哪些
三、數據存儲的方式有哪些
四、采用圖數據平臺可以帶來哪些好處
五、如何借助圖技術,創新零售業發展
當前數據面臨的趨勢與挑戰
數據孤立
當前有些數據相互孤立。數據存儲和應用通常為單個部門提供服務。如人力資源部門使用一個平臺,而銷售部門則可能會使用另一個平臺。
數據擴張與數據湖
在深度學習的大背景下,大多數數據都有數據湖、數據倉庫、關系型數據庫,作為記錄系統、客戶數據、交易數據、產品數據和訂單數據等基礎。這種數據分散狀態將導致數據擴張。
其中數據湖可存儲大量結構化、半結構化和非結構化數據,且成本較低,因此備受歡迎。
從成本來看,數據湖具有很大的吸引力,在存儲任何類型的數據時起著重要作用,包括應用和服務生成的日志文件。將數據存入數據湖的操作既簡單又方便。然而,管理并了解這些數據則困難重重。
云存儲
云計算具有顛覆性意義,但仍面臨管理挑戰,這主要歸結于更多數據存儲在更多系統中。個人云數據有可能存儲在 iCloud、Google Drive、Dropbox、Evernote、Gmail 和 Notes 中。?
這時就需要處理大量數據,這些數據不僅格式不同,且部分數據是重復的,而且大多數數據都沒有相互關聯性。
歷史數據將會被遺忘
歷史數據為機器學習預測提供動力。隨著新冠疫情的爆發引起經濟動蕩,導致歷史數據過時。如歷史數據通常被用來預測購買行為。但由于疫情期間的封控狀態,網購成為市場主導購物方式,購買行為幾乎在一夜之間發生了變化。由于消費者行為發生翻天覆地的變化,因此歷史數據無法對購買行為做出準確的預測。
在數據有限的情況下,數據關聯的重要性和價值日益凸顯。將數據存入圖數據平臺可捕獲數據關聯和數據關系。當然歷史數據是有價值的,但存儲數據和數據之間已存在的關系可以提高預測能力,即使在沒有相關歷史數據的情況下也是如此。
這是因為數據關聯和關系是數據中最具預測性的元素。以上所有因素都在推動企業向關聯圖數據平臺中的數據轉型,從而獲取知識。
知識圖譜類別
知識圖譜就像知識本身一樣,涉及方方面面,信息廣泛。一般來說,知識圖譜分為兩類:行動型知識圖譜和決策型知識圖譜。
行動型知識圖譜
數據管理是知識圖譜的一個重要用例。很多知名企業使用知識圖譜創建元數據中心,并以此捕獲數據沿襲:數據源、轉換方式以及清理方式。知識圖譜針對復雜的數據傳輸管道進行建模,以便輕松識別數據的消費者和生產者, 并集成新的數據源。
借助數據源的相關強大基礎,企業可以針對采集到的數據采取行動,準確了解數據源、數據生產者和消費者。
除了數據管理之外,行動型知識圖譜還用于個性化推薦。行動型知識圖譜將客戶和產品等所有相關數據匯總到一個 360 度視圖中,從而推動采取大量行動,如識別有流失風險的客戶以及提供可說服客戶留下來的有效建議。
用于數據分析的決策型知識圖譜
知識圖譜構成現代數據和分析的基礎。憑借知識圖譜捕獲的數據,可以捕獲及存儲數據中固有的所有關系,無需猜測數據相關性。這樣一來,知識圖譜就代表對數據更忠實的表述,并使得企業能夠解鎖其預測能力。
借助決策型知識圖譜,最終目標是做出更好的決策,無論該決策是來自人的決策還是算法決策。這些決策可以通過以下方式獲得支持。
圖查詢
可批量回答有關知識圖譜的任何問題。Boston Scientific 使用高級查詢分析根本原因,并確定導致缺陷的故障組件組合(這是一種反向推薦)。
圖算法
可識別數據中的模式,如兩點之間的最短路徑或最有影響力的客戶。
OrbitMI 使用決策型知識圖譜來執行復雜的集裝箱船運航線規劃。通過尋路算法,他們在不到一秒的時間內就規劃出了海上航線。此外,他們的知識圖譜還可支持 SaaS 分析產品。知識圖譜不僅會產生經濟效能,而且還能帶來高效的復雜線路規劃,并減少6萬噸碳排放。
圖查詢和圖算法還可以解鎖機器學習的預測功能。阿斯利康在其知識圖譜中使用圖算法和機器學習來識別患者病歷原型和模式。這項研究使該公司能夠為早期干預確定強有力的觸點,從而改善腎臟等方面疾病的治療效果。
數據存儲方式有哪些?
眾所周知,數據具有 “潛在” 價值,一些公司能夠相較于其他公司從數據中提取更多的價值。要將數據高效地轉化為信息、知識和價值,需要考慮很多驅動因素,如數據驅動的領導方式、 公司員工掌握的知識和技能、業務流程以及組織文化。但在從數據到洞見的過程中,另一個重要驅動因素是數據存儲技術。從數據中提取價值的過程取決于存儲方式、訪問的難易程度,以及數據與組織內其他相關數據、信息和知識場景的相關程度。
數據庫管理系統具有以下三種常見類型:
關系數據庫管理系統
將數據存儲在表格中。當數據之間的關系穩定并且可以在頂層表格定義中捕獲時,常常會使用這種類型。關系數據庫可以快速處理大量記錄,使用的存儲空間往往較少。但在處理場景可能隨時間變化的動態數據時,靈活性略顯不足。
非關系數據庫管理系統
提供多種非表格形式的替代方法來組織、管理、存儲和檢索數據。傳統上,非關系數據庫管理系統針對特定數據類型進行優化,通常是舊式系統,難以處理更新、更動態的工作負載。
動態數據管理系統
比 RDBMS 更敏捷和高效,更廣受關注,隨著其不斷發展成熟并克服潛在問題,2016-2019 的 CAGR 增長率達到 83.2%。圖數據庫就是一種動態數據庫管理系統。隨著圖驅動分析和人工智能工具的需求不斷增加,對圖數據庫和圖數據庫平臺的需求也在增加。
圖數據平臺帶來哪些好處?
揭示隱藏結構
圖可以揭示數據中的隱藏結構,其中數據是未知的,不需要廣泛的數據存儲,也不需要有關數據組織方式的大量先驗知識。
提高效率
在某些情況下,圖數據庫管理系統可以比傳統 RDBMS 更快、更有效, 因為它們能夠快速分析模式和關系。圖數據庫也簡化了提取-執行周期, 可以更快地執行查詢。
功能廣泛
圖可以應用于各種問題和應用。其中包括:?
發現人、地點或事物之間的關系模式?
映射或繪制事物位置之間的結構空間關系?
從人類語言捕捉語義結構以便系統地理解內容基于譜系、基于空間和基于執法/情報服務的“已知關聯”分析
藥理學研究、流行病學和效用網絡分析
利用人工智能
圖很可能在未來的人工智能中發揮關鍵作用。由于復雜系統中的行動和后果通常會導致數據關系模式發生變化,因此圖數據庫正在幫助推動機器學習和其他 AI 相關操作實現創新。
企業了解將數據轉化為組織中的信息、知識和商業價值的核心途徑。確定圖數據庫和平臺如何幫助企業應對挑戰數據庫在促進組織將數據轉換為信息、知識和商業價值方面發揮著重要作用。了解圖帶來的優勢,利用這些優勢來提高組織的學習能力。
藍海大腦圖數據一體機具有精簡的高可用集群架構。軟硬一體,高度集成。開箱即用。優于目前的集中式存儲架構X3,高于集中式存儲架構X5。專業的運維平臺,深度監控管理一體機系統。分布式存儲,高可靠性,全架構冗余設計,避免任意單點故障,以及跨節點數據保護等,更好地為各行各業服務。
零售業借圖技術飛速創新
當今社會,零售商面臨著許多復雜的全新挑戰。由于開銷小且銷量高,亞馬遜等線上巨頭以較低成本快速配送產品,這導致規模較小的零售商接連倒閉。
想要站穩腳跟,零售商必須足夠靈活,既要面對巨大的線上競爭,還要應對零售業的另一個新現狀:客戶現在處于價值鏈的中心。為了適應這些現狀,零售商必須實時控制庫存、支付和配送系統。然而,對于受傳統基礎設施拖累的傳統零售商來說,實時響應十分困難。
為了重新設計從線性到環形的高度關聯價值鏈,零售商需要迅速且低成本地對其基礎設施進行現代化改造。此外,基于互聯網的線上的零售商必須找到一種方法來處理規模和復雜性,以保持競爭優勢。
下面我們一起了解下線下零售商如何利用圖數據平臺技術的強大功能來應對這些迫在眉睫的挑戰。
個性化產品和促銷推薦
向線上顧客提供實時推薦可實現收入最大化,既能改善客戶體驗,又能增加銷量。然而,顧客想要的是經過精心設計的推薦,而不是一成不變或盲目的推薦。為了提升效果,推薦必須根據消費者的偏好、購物記錄、興趣和需求個性化。
實時推薦需要關聯大量復雜的買家和產品數據(以及常規關聯的數據),以了解客戶需求和產品趨勢。這無法通過關系型數據庫技術來實現,因為SQL查詢將會非常復雜,且實時提供推薦耗時過長。Hadoop 和 Spark 等大數據處理技術也面臨著同樣的問題,這些技術在電子郵件推薦等方面效果很好,每天發送一次推薦,但不是實時提供。
經過設計,圖數據平臺可快速查詢客戶的購買記錄,并立即捕獲其當前在線訪問中顯示的任何新興趣,這兩項都是提供實時推薦的關鍵。由于關系被視為圖數據平臺中的第一級實體,零售商可將客戶的瀏覽記錄與購買記錄以及線下產品和品牌關聯起來。這樣一來,實時推薦算法就能夠利用客戶過去和現在的選擇來提供個性化推薦。無需提前在線下進行計算,由此可以很好的解決延遲問題。
由客戶 360 提供支持的個性化體驗
零售商可以根據客戶的愿望、興趣和需求提供相關內容,從而個性化在線客戶體驗。這樣不僅可以提高客戶參與度,還能提高收入和客戶忠誠度。例如,通過在產品描述旁邊提供相關的博客文章,零售商可以將自己刻畫成使用特定產品方面的專家。這樣一來,客戶認為自己從可靠來源獲得有價值的信息,因此增加訪問和購買。?
零售商還可以使用路徑分析來幫助改善成效,包括分析導致購買的客戶行為,并使用這些數據吸引客戶走上更有利于盈利的道路。這可能需要調整內容,或者更改未來的客戶點擊鏈接后前往的目標位置。
零售商還可以識別由一組客戶共享的維度,并根據這些屬性對其進行分群處理。例如,可以圍繞有或沒有孩子這一屬性對客戶進行分群處理,也可根據職業和崗位進行分群處理,例如職業生涯早期的工程師與經驗豐富的營銷副總裁。不同維度的消費者有不同的職責和收入,因此購買習慣也不同。零售商可以使用這些信息為每個客戶提供個性化內容。
零售商擁有大量數據,可以用來確定為客戶提供服務的最佳路徑和內容。這些數據包括與產品、市場、社交媒體、主數據、數字資產等相關的數據。然而,這些數據通常存儲在信息孤島中,導致整合并識別向客戶提供相關內容的機會愈加困難。?
如需將所有數據源合并到一個個性化引擎中,關系型數據庫將無法實時進行復雜的推薦計算。企業可以將數據移至 Hadoop 或數據倉庫中,以便提前為每個客戶計算推薦,但這些推薦通常會稍微有些過時。此外,如果在任意一天中只有少量客戶訪問網站,每天為整個客戶群提前計算推薦則會降低效率。
圖數據平臺不是將所有客戶數據集中到一個系統中,而是把數據留在原地,并添加圖分析。可以為每個客戶提供一個部門標識符,然后將其與主客戶標識符綁定。每個部門或業務線的標識符由各個標識符組成,從而為每個客戶生成一個雙重疊加圖。這使零售商能夠更全面地了解客戶關系,并在客戶與公司進行交互時隨時快速導航回原始系統。
利用圖技術優化電商配送服務路線
亞馬遜已經設定發貨和配送標準。由于亞馬遜 Prime 會員可享受兩天免費配送,使得電商購物者都不愿等待兩天以上才能收到網購商品。因此,零售商必須達到或超過這一標準,否則就有可能將顧客拱手讓給亞馬遜。
為了縮短配送時間,零售商必須了解店面和配送中心的庫存以及運輸網絡。例如,需要了解路線問題是否會導致從離客戶較近的配送中心發出的產品延遲送達,或者產品缺貨是否會導致產品無法按指定配送日期送達。確定最快的配送路線需要支持大量復雜的路線查詢,并具備快速一致的性能。
由于數據具有高度關聯的特點,電商配送服務路線與圖數據平臺好比“天作之合”。這不僅是因為數據點之間需要大量“躍點”,而且可以有許多不同的路徑以及任意數量的排列。即使在一個訂單中,這些排列也可能進行優化,并成為一年中不同時間里針對不同產品的最佳路徑。圖數據平臺可將這些不同因素考慮在內,并支持復雜的路線查詢,以簡化配送服務。
供應鏈可視性
供應鏈既龐大又復雜。產品通常由不同的原料或部件組成,這些部件在不同的供應商之間流通,其中每一個部件都可能由子部件組成,而子部件可能來自其他子部件和世界各地的其他供應商。由于這種復雜性,零售商往往只知道他們的直接供應商,這可能導致風險和合規方面的問題。
零售商需要公開透明地了解整個供應鏈,以檢測欺詐、污染、高風險地點和未知產品來源。例如,如果特定原材料以某種方式受到損害,公司必須能夠迅速識別每個受影響的產品。這需要在沒有延遲或其他性能問題的情況下管理和搜索大量數據。透明度對于識別供應鏈中的薄弱環節或其他單一故障點也很重要。例如,以前一個零件或配料可從三個供應商處獲得,但現在只能從一個供應商處獲得,那么零售商就要了解這可能會對未來產量造成的影響。
要實現整個供應鏈的可視性,需要建立深層關聯。關系型數據庫不是用來處理大量遞歸查詢或關聯的,因此性能會受到影響。然而,圖數據平臺是專門針對搜索和分析關聯數據而設計的。圖數據平臺的架構首先是圍繞數據關系構建的,這使零售商和制造商能夠在不出現性能問題的前提下管理搜索大量數據,并實現他們所需的供應鏈可視性。
借助圖技術提升營收管理
對于消費者來說,貨比三家從未像今天這樣容易。幾分鐘內,消費者就可以在十幾家店鋪之間對比特定產品的價格,而且整個過程可以輕松方便地完成。他們甚至可以在不同零售商的實體店購物時比較價格,并從競爭對手那里購買商品。為了打價格戰并優化盈利能力,零售商需要實時提供具有競爭優勢的價格。?
有競爭優勢的定價基于庫存、地點、季節、消費者需求等各種因素,這些因素非常不穩定,變化很快。例如,如果一家酒店打算根據籃球錦標賽定價,且這場錦標賽共有七場比賽,那么那些舉辦比賽的城市的庫存將減少,并進行相應定價。但如果錦標賽在五場比賽后結束,那么原本最后兩場比賽的庫存將會增加,且價格也應適當調整。
此外,每個零售網點可能會根據市場情況制定不同的價格。零售商對其微觀市場的了解越多,并優化產品定價以匹配庫存,適當提高利潤率和銷量的方法也就越多。然而,關系型數據庫跟不上這些數據變化的節奏,且性能不佳會使其無法跨多個地點提供實時價格更新。?
圖數據平臺可以幫助零售商解決收入管理問題,同時提供實時定價引擎所需的處理能力和性能。許多變量之間的相互依賴關系可以用圖表示,這為零售商提供了可確定并高效計算價格的方法,即使在這種依賴關系快速變化的情況下。
系統管理員:網絡和 IT 運營
零售 IT 組織也受益于圖數據平臺。通常,公司擁有復雜的網絡,并且越來越多的組件存儲在云或多個云以及內部數據中心。在大多數傳統的配置管理數據庫 (CMDB) 中,要表示每一項 IT 資產并了解它們的關聯方式十分困難。?
以運行多個虛擬機 (VM) 的物理服務器為例,這些 VM 可能托管運行不同進程并關聯不同子網的容器。在這種情況下,可以使用圖數據平臺來查看所有組件的關聯方式。
系統管理員還可以使用圖數據平臺來維護由所有不同網絡資產組成的圖。此圖可用于更好地保護網絡及檢測漏洞或限制入侵風險的傳播。
零售商面臨著許多挑戰,這其中很大一部分來自精通技術的線上零售商。從提供實時產品推薦到 態定價及優化配送路線,零售商必須迅速克服這些挑戰,才能站穩腳跟并獲得自身競爭優勢。
?
此外,零售商還必須提高響應速度,以便趕在競爭對手之前應對不斷變化的消費者和技術趨勢。通過圖數據平臺可幫助零售商了解關聯數據,且與傳統技術相比,能夠更深入地利用數據關系,以提供實時產品推薦、優化配送路線能力。
審核編輯:湯梓紅
電子發燒友App







































評論