国产精品久久久aaaa,日日干夜夜操天天插,亚洲乱熟女香蕉一区二区三区少妇,99精品国产高清一区二区三区,国产成人精品一区二区色戒,久久久国产精品成人免费,亚洲精品毛片久久久久,99久久婷婷国产综合精品电影,国产一区二区三区任你鲁

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

什么是數據倉庫、數據集市、數據湖?

工業互聯網前線 ? 來源:一個數據玩家的自我修養 ? 作者:一個數據玩家的自 ? 2020-09-21 10:44 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

來源:一個數據玩家的自我修養 本文已授權

經常看到有人問這個問題,數據玩家也看過很多解釋,感覺都不夠直觀,這里,我嘗試用一個大家都理解的例子來說明。

什么是數據倉庫?

大家都去宜家買過東西吧,還記得一樓的大倉庫不,你如果看中了某個家具,想要自己去倉庫提貨,一般都會記下商品上的編碼:

這個編碼對于顧客來說,肯定是沒有任何含義的,看到這個編碼,不可能知道他是一個什么商品。

但是這個編碼,對于倉庫管理員來說是有含義的,他們可以清楚的知道,是哪一個貨架,哪一個位置。

當然,顧客到倉庫里順著貨架和位置也可以找到商品,但是總歸不太直觀,挑選的過程還是得在樓上進行。

因此數據倉庫就相當于宜家的一樓倉庫,在這里,數據(家具)按照特定的模型,如FS-LDM等(貨架-位置)組織起來,這種模型,對于顧客(業務人員,數據最終用戶)是不友好的,但是對于科技人員(倉庫管理員,宜家員工)來說相對友好,因為他按照一種更加集約化的規則將數據(家具)管理起來了,存放集中、規整,提取數據(提貨)不用跨庫(貨倉)尋找,查找的效率更加高。

那什么是數據集市呢?

還是用這個例子,上文提到,數據倉庫對業務人員不是很友好,同樣,你總不能讓顧客直接逛倉庫吧?顧客的需求,是按照家具的種類分門別類,按照家庭的不同房間,組合在一起展示的,正如宜家樓上的展廳:

雖然也被吐槽像迷宮一樣,但是總的來說,購物體驗肯定比逛倉庫來得好多了。

所以,數據集市就像宜家樓上的展廳,正如其名字“集市”一樣,是一個面向最終用戶(顧客)的數據市場,在這里,數據(家具)以一種更加容易被業務人員(顧客)接受的方式組合在一起,這些組合方式可能是多變的,因為業務人員(顧客)的需求是多變的,因此我們需要定期調整集市的計算口徑(展廳的陳列方式),經常會創建新的數據集市(裝修新的展廳)。

數據倉庫和集市的概念理解了,其他一些相關問題也就迎刃而解,比如為什么有了數據倉庫還要建數據集市?等等。

那什么是數據湖呢?

數據湖至今仍然沒有一個特別標準的概念,各種概念中,比較統一的一點是數據湖存儲的是未經加工的原始數據,包含結構化和非結構化的各類數據。數據玩家仍然嘗試用上面的例子來解釋。

大家都知道,宜家的家具是需要自己組裝的,所以宜家的顧客們都有一些動手能力,他們突發奇想,所有的家具能不能全部拆散成零部件存放,由顧客們根據實際需要挑選零部件自行拼裝?

所以,數據湖就是一個存儲了所有企業內原始數據(家具零部件)的存儲,這就帶來一系列問題,加工后數據的存儲已經非常復雜,原始數據則依賴更多的管理功能,不然數據又多又雜難以管理,數據湖會退化為數據沼澤。此外,原始數據如果缺少統一的數據標準,就像不同的家具零部件之間的接口不同,那就無法組裝在一起了。

因此,數據湖必須有完善的數據管理功能,也依賴于統一的數據標準和良好的數據質量管理。

那什么又是數據中臺呢?

數據中臺也沒有一個特別明確的定義,這里很難套用宜家的例子強行解釋了,我們來看下各類數據平臺:

在我們傳統的數據應用中,隨著數據對于業務友好度的增加,其時效性也在減弱。而我們的目標,顯然是數據又快又好。既然各部門的需求都不一樣,為何不讓業務自助分析數據呢?于是我們有了右上角的目標狀態。但是這個理想狀態和我們現在的數據應用中間有巨大的空隙,靠什么來填補?答案就是數據中臺。

我們可以將其分為狹義的數據中臺和廣義的數據中臺。狹義的數據中臺,指的是一套數據應用和工具,包括分布式ETL、數據資產管理、數據標簽管理、數據沙箱、自助分析平臺、元數據管理、數據質量管理等等,底層則以現有的數倉、大數據平臺等為數據源,為企業提供數據資產管理的能力,并持續挖掘數據價值,持續提供數據智能服務。

廣義的數據中臺,則在狹義的數據中臺基礎之上,包含了頂層數據戰略,數據治理體系以及數據管理及運營、數據文化培養和組織架構支撐,是一套持續管理和運營的體系。

可以這么說,狹義的數據中臺,是專為達成數據中臺的使命而打造,一類是讓數據更快的處理、整合、加工,比如分布式ETL工具。隨著傳統數據被大數據平臺逐步替代,ETL工具對于大數據平臺的適配也需要與時俱進,支持分布式計算、彈性計算,并且減少開發量。

另一類是讓數據更好的產生業務價值,比如數據標簽管理,自助分析平臺等。數據標簽大家都在用,但是真正深度使用的企業都會感覺:建好容易用好難,如果沒有一套標簽管理系統,標簽是否重復加工,標簽的使用率、準確性等都無從掌控,業務部門想要針對近期營銷活動新建一個標簽,還得走開發流程,時效性也難以保證。數據標簽管理系統就是為了解決數據標簽的使用問題而建立。自助分析平臺則是方便業務人員自助進行數據分析、加工、探索的平臺,它與數據沙箱結合,直接將去隱私化的生產數據提供業務人員分析,使數據更快的產生價值,支撐關鍵決策。

廣義的數據中臺,則是輔助狹義數據中臺達成使命的機制,雖然看起來都很“虛”,但是卻是數據中臺成功落地的必要保障。

那所有這些都必須做嗎?

這個問題要看具體的企業情況,總的來說,一個大原則是以滿足業務發展為第一優先,不要為了做基礎設施而做基礎設施,一定要以能解決業務訴求為最終目的。

《人月神話》里早就宣告了銀彈不存在,自然,數據倉庫、數據集市、數據湖、數據中臺都不是銀彈,千萬不能以為做了他們就水到渠成,數字化轉型就自動完成了。

簡言之,用了一系列時髦的新技術不見得就是數字化領軍企業,不用也不見得就是古典互聯網時代的落后作坊。關鍵是認清自身的數字化現狀,擬定數字化目標,制定數字化路徑,優選場景,實現價值。新技術、各類數據基礎設施只是這條道路上,一套套切實可行的行動方案,是把過去銀行的種種數字化的嘗試,重新以體系化、結構化的方法論梳理,并且賦予當下最新的技術架構予以實施。

原文標題:數據倉庫、數據集市、數據湖、數據中臺到底有什么區別?

文章出處:【微信公眾號:工業IoT】歡迎添加關注!文章轉載請注明出處。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 數據
    +關注

    關注

    8

    文章

    7335

    瀏覽量

    94754
  • 數據倉庫
    +關注

    關注

    0

    文章

    65

    瀏覽量

    10972

原文標題:數據倉庫、數據集市、數據湖、數據中臺到底有什么區別?

文章出處:【微信號:IndustryIOT,微信公眾號:工業互聯網前線】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    1688庫存API:多倉庫同步,庫存周轉快!

    庫存流程。 第一步:理解多倉庫同步的挑戰 在實際業務中,企業往往擁有多個倉庫(如華東倉、華南倉),庫存數據分散。不同步會導致超賣、缺貨等問題。傳統方式依賴手動更新,效率低下且易出錯。多倉庫
    的頭像 發表于 01-08 14:47 ?240次閱讀
    1688庫存API:多<b class='flag-5'>倉庫</b>同步,庫存周轉快!

    BI決策分析系統的關鍵組成部分:業務數據整合有何意義

    ?在數聚股份看來,業務數據整合是bi決策分析系統的關鍵組成部分,可將來自多個源系統的數據進行整合,并將它們合并到數據倉庫以作分析。不過,對于bi決策分析系統的業務數據整合策略,
    的頭像 發表于 12-18 13:16 ?235次閱讀

    人工智能+正當時,中山腫瘤AI數據守護生命之火

    喚醒沉睡的數據冰山,中山腫瘤AI數據湖里的科技暖意
    的頭像 發表于 12-16 00:04 ?5634次閱讀
    人工智能+正當時,中山腫瘤AI<b class='flag-5'>數據</b><b class='flag-5'>湖</b>守護生命之火

    Next Pathway成為Snowflake最高級別合作伙伴

    的持續投入。 Next Pathway始終展現出卓越的專業能力,以無可匹敵的效率幫助全球客戶將復雜的數據倉庫數據遷移至Snowflake AI數據云平臺。“精英級”地位特別認可
    的頭像 發表于 12-04 18:08 ?1071次閱讀
    Next Pathway成為Snowflake最高級別合作伙伴

    UART接口數據線接收和發送數據

    具體方法和步驟 UART模塊依照UART協議標準的異步方式發送和接收數據,每個UART模塊有TX和RX兩根數據線,TX為輸出,RX為輸入。使用TX數據線串行發送數據,使用RX
    發表于 10-29 07:37

    部署Denodo與數據倉架構聯用,用戶可獲得345%投資回報率(ROI),實現3–4倍數據洞察提速

    AI Hackathon 2025,助力企業通過可信數據和先進 AI 技術加速創新。此次新聞稿覆蓋兩大重點:數據倉價值釋放的最新研究,以及全球開發者參與的 AI 創新賽事。 研究發現:邏輯
    的頭像 發表于 10-23 17:27 ?676次閱讀

    倉庫物品計數遠程監控系統方案

    庫存已滿時現場紅燈常亮,但仍需員工現場值守。 對此,物通博聯提供倉庫物品數據采集到ERP系統的解決方案,以實現倉儲的遠程管理與智慧升級。物通博聯工業智能網關通過接入計數傳感器,能夠實時采集物品數據對接到ERP系統中
    的頭像 發表于 09-16 14:11 ?589次閱讀
    <b class='flag-5'>倉庫</b>物品計數遠程監控系統方案

    微軟推出全新Microsoft Sentinel數據國際版

    近期,MicrosoftSentinel數據(國際版)正式開放公開預覽,重塑安全運營架構。它通過統一所有安全數據,以遠低于傳統方案的成本,解決了海量數據管理和可見性不足的痛點。這一新
    的頭像 發表于 08-04 15:36 ?973次閱讀

    數據數據恢復—MongoDB數據庫文件丟失的數據恢復案例

    MongoDB數據數據恢復環境: 一臺操作系統為Windows Server的虛擬機上部署MongoDB數據庫。 MongoDB數據庫故障: 工作人員在MongoDB服務仍
    的頭像 發表于 07-01 11:13 ?637次閱讀
    <b class='flag-5'>數據</b>庫<b class='flag-5'>數據</b>恢復—MongoDB<b class='flag-5'>數據</b>庫文件丟失的<b class='flag-5'>數據</b>恢復案例

    藍牙數據通道空口包(數據包)

    ? 與藍牙廣播包相對應,藍牙數據包是另一種Bluetooth LE packet。藍牙數據包是藍牙數據信道空中包的簡稱,表示空中包只在藍牙數據信道上傳輸,即除37/38/39之外的其他
    發表于 06-03 10:51

    華為發布AI數據解決方案加速行業智能化 AI時代數據覺醒

    正式發布AI數據解決方案,加速AI行業化落地。 華為公司副總裁、華為數據存儲產品線總裁周躍峰博士 數字化轉型已經進行了幾十年,很多事發生了變化,只有一樣事情從來沒有變化過,那就是“數據
    的頭像 發表于 04-30 18:01 ?1586次閱讀
    華為發布AI<b class='flag-5'>數據</b><b class='flag-5'>湖</b>解決方案加速行業智能化 AI時代<b class='flag-5'>數據</b>覺醒

    PolarDB×ADB雙擎驅動 華鼎冷鏈打造冷鏈數據智能反應堆

    完成從自建分布式數據庫到云原生數據庫PolarDB MySQL,再到云原生數據倉庫AnalyticDB MySQL(ADB MySQL)的全鏈路升級,實現了事務處理和數據分析一體化。
    的頭像 發表于 04-15 15:13 ?547次閱讀
    PolarDB×ADB雙擎驅動 華鼎冷鏈打造冷鏈<b class='flag-5'>數據</b>智能反應堆

    #### KEPServerEX 數據存儲插件\\-2

    上次我們介紹了Datalogger插件的前三式,展示了一些常見的觸發器設置,例如數據變化存儲,定時存儲等等,接下來我們繼續講解后三式。 一、 現在有一個需求是通過邏輯判斷有條件的進行存儲,如當某一個
    發表于 04-09 16:09

    濕度數據記錄儀是什么?一文為你解答

    在日常生活以及常見的工業場景當中,濕度是很重要的一個因素。從居住的房間舒適度,到一些對濕度要求極高的實驗室、倉庫等場所,可能都需要進行精準的濕度把控。在這個過程中,濕度數據記錄儀發揮著重要的作用
    發表于 03-31 10:35

    注塑機數據采集網關和數據中臺有哪些聯系特點

    。它將這些分散的、來自不同注塑機的數據進行收集和整理,為數據中臺提供原始數據來源。 數據中臺實現集中存儲:數據采集網關通過網絡將采集到的
    的頭像 發表于 03-25 15:38 ?665次閱讀
    注塑機<b class='flag-5'>數據</b>采集網關和<b class='flag-5'>數據</b>中臺有哪些聯系特點